-
公开(公告)号:CN116306603A
公开(公告)日:2023-06-23
申请号:CN202310122280.2
申请日:2023-01-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/258 , G06F40/30 , G06F40/126 , G06F40/194 , G06F18/214
Abstract: 本说明书实施例公开了一种标题生成模型的训练方法、标题生成方法、装置、存储介质及电子设备,方法包括:获取样本视频片段的训练文本,训练文本包括样本视频片段的样本拆条文本和样本拆条文本的前缀文本,前缀文本为被遮罩样本拆条文本中标注关键词的文本;将训练文本输入标题生成模型,通过标题生成模型,基于注意力机制对训练文本进行编码,得到训练文本的语义特征;通过标题生成模型,基于训练文本的语义特征进行预测,输出样本拆条文本中的预测关键词以及样本视频片段的预测标题;基于预测关键词与标注关键词之间的第一差异信息,以及预测标题与样本视频片段的标注标题之间的第二差异信息,对标题生成模型进行训练。
-
公开(公告)号:CN112804580A
公开(公告)日:2021-05-14
申请号:CN202011622535.4
申请日:2020-12-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: H04N21/433 , H04N21/439 , H04N21/488 , G06F40/211 , G06F40/253 , G06F40/30 , G06K9/00
Abstract: 说明书披露一种视频打点的方法和装置。一种视频打点的方法,包括:从待打点的目标视频中提取出音频,并将所述音频转换为对应的文本;将所述文本划分为若干个文本段落;确定各文本段落的段落标题;基于划分后得到的文本段落确定所述目标视频的打点位置,以将所述目标视频划分为若干视频片段,并为所述视频片段添加对应文本段落的段落标题,以实现所述目标视频的打点。
-
公开(公告)号:CN115499705A
公开(公告)日:2022-12-20
申请号:CN202211084755.5
申请日:2022-09-06
Applicant: 支付宝(杭州)信息技术有限公司
IPC: H04N21/44 , G06F16/78 , G06F16/783 , G10L15/02 , G10L15/06
Abstract: 本说明书实施例提供一种视频处理方法和装置,该方法包括:在对待处理视频进行视频拆条时,获取待处理视频中的语音数据,语音数据中包括多个语句;对语音数据进行特征提取,得到与多个语句对应的多个语音特征;基于预先训练的语句分类模型对多个语音特征进行处理,得到多个语句的段落标签,语句分类模型基于注意力机制对语音特征进行训练后得到;基于多个语句的段落标签对待处理视频进行视频拆条,生成短视频。
-
公开(公告)号:CN114998878A
公开(公告)日:2022-09-02
申请号:CN202210462326.0
申请日:2022-04-28
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供关键词识别方法以及装置,其中,关键词识别方法包括:获取目标视频的字幕向量,根据字幕向量,基于预设的疲劳度控制规则,识别目标关键词。实现了对字幕文本中目标关键词的自动识别,识别更为高效,并且由于疲劳度控制规则是基于字幕文本中关键词的预设分布信息设置得到的,所识别出来的目标关键词能够满足预设的分布条件,使得目标关键词更符合实际需求,在具体应用时识别结果更为准确。
-
公开(公告)号:CN112733660A
公开(公告)日:2021-04-30
申请号:CN202011622533.5
申请日:2020-12-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06K9/00 , G06F40/211 , G06F40/30 , G06K9/62 , G06F16/78 , G06F16/783 , G06N3/04 , G06N3/08
Abstract: 本说明书披露一种视频拆条的方法和装置。所述方法包括:从待拆条的目标视频中提取出音频,并将所述音频转换为对应的文本;提取出所述文本中各句子单元的文本特征;在所述目标视频中确定所述句子单元对应的视频片段,并从所述视频片段中提取出所述句子单元对应的视频特征;基于各句子单元对应的文本特征和视频特征,将所述文本划分为若干文本段落;基于划分后得到的文本段落,将所述目标视频对应拆条为若干视频片段。
-
公开(公告)号:CN112733654A
公开(公告)日:2021-04-30
申请号:CN202011617772.1
申请日:2020-12-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06K9/00 , G06F40/211 , G06F40/30 , G06K9/62 , G06F16/78 , G06F16/783 , G06N3/04 , G06N3/08
Abstract: 说明书披露一种视频拆条的方法和装置。一种视频拆条的方法,包括:从待拆条的目标视频中提取出音频,并将所述音频转换为对应的文本;从所述文本中确定出若干条话题句;以各话题句为文本段落的起始句,将所述文本划分为若干文本段落;基于划分后得到的文本段落,将所述目标视频对应拆条为若干视频片段。
-
公开(公告)号:CN114998878B
公开(公告)日:2025-04-04
申请号:CN202210462326.0
申请日:2022-04-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V20/62 , G06V10/82 , G06N3/0455
Abstract: 本说明书实施例提供关键词识别方法以及装置,其中,关键词识别方法包括:获取目标视频的字幕向量,根据字幕向量,基于预设的疲劳度控制规则,识别目标关键词。实现了对字幕文本中目标关键词的自动识别,识别更为高效,并且由于疲劳度控制规则是基于字幕文本中关键词的预设分布信息设置得到的,所识别出来的目标关键词能够满足预设的分布条件,使得目标关键词更符合实际需求,在具体应用时识别结果更为准确。
-
公开(公告)号:CN112804580B
公开(公告)日:2023-01-20
申请号:CN202011622535.4
申请日:2020-12-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: H04N21/433 , H04N21/439 , H04N21/488 , G06F40/211 , G06F40/253 , G06F40/30 , G06V20/40
Abstract: 说明书披露一种视频打点的方法和装置。一种视频打点的方法,包括:从待打点的目标视频中提取出音频,并将所述音频转换为对应的文本;将所述文本划分为若干个文本段落;确定各文本段落的段落标题;基于划分后得到的文本段落确定所述目标视频的打点位置,以将所述目标视频划分为若干视频片段,并为所述视频片段添加对应文本段落的段落标题,以实现所述目标视频的打点。
-
-
-
-
-
-
-