-
公开(公告)号:CN116304012A
公开(公告)日:2023-06-23
申请号:CN202211538156.6
申请日:2022-12-02
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35
Abstract: 本说明书实施例提供了一种大规模文本聚类方法及装置。该方法中包含粗聚类和二次精细聚类。首先,通过语义表示模型确定多条文本分别对应的语义向量;基于多条文本的语义向量,确定多条文本彼此之间的相似度矩阵。接着,在粗聚类阶段,从相似度矩阵中确定多条文本分别对应的相似度最大的M个相似文本,并在M个相似文本对应的相似度大于阈值时,将对应的文本作为筛选出的中心文本,以便快速地去除大量孤立噪点。然后,基于中心文本在相似度矩阵中对应的数据,得到候选类簇,并对存在交叉文本的候选类簇进行合并,之后再对合并后的类簇进行二次精细聚类。
-
公开(公告)号:CN112804580B
公开(公告)日:2023-01-20
申请号:CN202011622535.4
申请日:2020-12-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: H04N21/433 , H04N21/439 , H04N21/488 , G06F40/211 , G06F40/253 , G06F40/30 , G06V20/40
Abstract: 说明书披露一种视频打点的方法和装置。一种视频打点的方法,包括:从待打点的目标视频中提取出音频,并将所述音频转换为对应的文本;将所述文本划分为若干个文本段落;确定各文本段落的段落标题;基于划分后得到的文本段落确定所述目标视频的打点位置,以将所述目标视频划分为若干视频片段,并为所述视频片段添加对应文本段落的段落标题,以实现所述目标视频的打点。
-
公开(公告)号:CN112804580A
公开(公告)日:2021-05-14
申请号:CN202011622535.4
申请日:2020-12-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: H04N21/433 , H04N21/439 , H04N21/488 , G06F40/211 , G06F40/253 , G06F40/30 , G06K9/00
Abstract: 说明书披露一种视频打点的方法和装置。一种视频打点的方法,包括:从待打点的目标视频中提取出音频,并将所述音频转换为对应的文本;将所述文本划分为若干个文本段落;确定各文本段落的段落标题;基于划分后得到的文本段落确定所述目标视频的打点位置,以将所述目标视频划分为若干视频片段,并为所述视频片段添加对应文本段落的段落标题,以实现所述目标视频的打点。
-
公开(公告)号:CN111738532A
公开(公告)日:2020-10-02
申请号:CN202010817707.7
申请日:2020-08-14
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种事件对对象影响度的获取方法和系统,其包括:获取目标事件;将所述目标事件加入事件图谱中,并将所述目标事件对应的事件节点与所述事件图谱中至少一个描述节点关联,获得更新后的事件图谱;所述事件图谱包括多个节点以及节点之间的边权;所述节点包括事件节点、对象节点以及描述节点;在所述更新后的事件图谱中选取与所述目标事件对应的事件节点的关联路径不超过预设长度的对象节点,作为候选对象节点;利用影响度预测模型至少基于所述目标事件与各候选节点对应的候选对象,获得所述目标事件对各候选对象的影响度预测值。
-
公开(公告)号:CN112733660A
公开(公告)日:2021-04-30
申请号:CN202011622533.5
申请日:2020-12-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06K9/00 , G06F40/211 , G06F40/30 , G06K9/62 , G06F16/78 , G06F16/783 , G06N3/04 , G06N3/08
Abstract: 本说明书披露一种视频拆条的方法和装置。所述方法包括:从待拆条的目标视频中提取出音频,并将所述音频转换为对应的文本;提取出所述文本中各句子单元的文本特征;在所述目标视频中确定所述句子单元对应的视频片段,并从所述视频片段中提取出所述句子单元对应的视频特征;基于各句子单元对应的文本特征和视频特征,将所述文本划分为若干文本段落;基于划分后得到的文本段落,将所述目标视频对应拆条为若干视频片段。
-
公开(公告)号:CN112733654A
公开(公告)日:2021-04-30
申请号:CN202011617772.1
申请日:2020-12-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06K9/00 , G06F40/211 , G06F40/30 , G06K9/62 , G06F16/78 , G06F16/783 , G06N3/04 , G06N3/08
Abstract: 说明书披露一种视频拆条的方法和装置。一种视频拆条的方法,包括:从待拆条的目标视频中提取出音频,并将所述音频转换为对应的文本;从所述文本中确定出若干条话题句;以各话题句为文本段落的起始句,将所述文本划分为若干文本段落;基于划分后得到的文本段落,将所述目标视频对应拆条为若干视频片段。
-
公开(公告)号:CN111738532B
公开(公告)日:2021-02-05
申请号:CN202010817707.7
申请日:2020-08-14
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种事件对对象影响度的获取方法和系统,其包括:获取目标事件;将所述目标事件加入事件图谱中,并将所述目标事件对应的事件节点与所述事件图谱中至少一个描述节点关联,获得更新后的事件图谱;所述事件图谱包括多个节点以及节点之间的边权;所述节点包括事件节点、对象节点以及描述节点;在所述更新后的事件图谱中选取与所述目标事件对应的事件节点的关联路径不超过预设长度的对象节点,作为候选对象节点;利用影响度预测模型至少基于所述目标事件与各候选节点对应的候选对象,获得所述目标事件对各候选对象的影响度预测值。
-
-
-
-
-
-