-
公开(公告)号:CN119577080A
公开(公告)日:2025-03-07
申请号:CN202411594951.6
申请日:2024-11-08
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/3329 , G06F16/3332 , G06F16/334 , G06F16/31 , G06F16/383 , G06N5/04
Abstract: 本说明书实施例提供了文档处理方法及装置、信息检索方法及装置。该文档处理方法能对目标文档的文本内容进行分片处理,得到多个文本片段,之后将每个文本片段输入第一大语言模型进行模型处理,得到处理结果,其中包括若干知识片段,然后根据各知识片段,生成其各自对应于预设的若干标签类别的第一标签数据,并将各知识片段和第一标签数据对应存储到第一数据库,以使得第一标签数据用于知识问答检索。在信息检索方法中,在根据用户的信息检索请求确定出文本形式的用户问题后,根据用户问题生成对应于该若干标签类别的第二标签数据,之后基于第一数据库中的至少部分第一标签数据各自与第二标签数据之间的第一相关性,检索与用户问题相关的知识片段。
-
公开(公告)号:CN116955815A
公开(公告)日:2023-10-27
申请号:CN202310904983.0
申请日:2023-07-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F18/23 , G06F18/214 , G06Q10/0639
Abstract: 本申请公开了一种事务信息推荐方法、装置、存储介质、产品及电子设备,其中,方法包括:获取时段偏好模型,所述时段偏好模型用于计算用户对不同时段的事务信息的偏好分数,基于目标用户的用户特征和曝光事务信息的时效性特征,获得所述目标用户的时效性偏好向量,所述曝光事务信息为曝光于所述目标用户的事务信息,采用所述时效性偏好向量对所述时段偏好模型进行参数调制处理,获得目标偏好模型,基于所述用户特征和目标事务信息的内容特征,采用所述目标偏好模型对所述目标用户进行偏好预测处理,获得所述目标用户对所述目标事务信息的偏好分数,基于所述偏好分数,确定针对所述目标用户的所述目标事务信息的推荐策略。
-
公开(公告)号:CN114417819A
公开(公告)日:2022-04-29
申请号:CN202210083635.7
申请日:2022-01-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/205 , G06F40/284 , G06F16/35 , G06F40/166
Abstract: 本说明书公开了一种数据召回方法、装置、存储介质及电子设备,方法包括:当监听到第一内容平台的内容发布事件时,获取所述内容发布事件对应的内容数据,判断所述内容数据是否为目标类型的数据,若所述内容数据为所述目标类型的数据,则将所述内容数据召回至第二内容平台,增加了第二内容平台的内容供给。
-
公开(公告)号:CN115499705A
公开(公告)日:2022-12-20
申请号:CN202211084755.5
申请日:2022-09-06
Applicant: 支付宝(杭州)信息技术有限公司
IPC: H04N21/44 , G06F16/78 , G06F16/783 , G10L15/02 , G10L15/06
Abstract: 本说明书实施例提供一种视频处理方法和装置,该方法包括:在对待处理视频进行视频拆条时,获取待处理视频中的语音数据,语音数据中包括多个语句;对语音数据进行特征提取,得到与多个语句对应的多个语音特征;基于预先训练的语句分类模型对多个语音特征进行处理,得到多个语句的段落标签,语句分类模型基于注意力机制对语音特征进行训练后得到;基于多个语句的段落标签对待处理视频进行视频拆条,生成短视频。
-
公开(公告)号:CN114998878A
公开(公告)日:2022-09-02
申请号:CN202210462326.0
申请日:2022-04-28
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供关键词识别方法以及装置,其中,关键词识别方法包括:获取目标视频的字幕向量,根据字幕向量,基于预设的疲劳度控制规则,识别目标关键词。实现了对字幕文本中目标关键词的自动识别,识别更为高效,并且由于疲劳度控制规则是基于字幕文本中关键词的预设分布信息设置得到的,所识别出来的目标关键词能够满足预设的分布条件,使得目标关键词更符合实际需求,在具体应用时识别结果更为准确。
-
公开(公告)号:CN112733660A
公开(公告)日:2021-04-30
申请号:CN202011622533.5
申请日:2020-12-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06K9/00 , G06F40/211 , G06F40/30 , G06K9/62 , G06F16/78 , G06F16/783 , G06N3/04 , G06N3/08
Abstract: 本说明书披露一种视频拆条的方法和装置。所述方法包括:从待拆条的目标视频中提取出音频,并将所述音频转换为对应的文本;提取出所述文本中各句子单元的文本特征;在所述目标视频中确定所述句子单元对应的视频片段,并从所述视频片段中提取出所述句子单元对应的视频特征;基于各句子单元对应的文本特征和视频特征,将所述文本划分为若干文本段落;基于划分后得到的文本段落,将所述目标视频对应拆条为若干视频片段。
-
公开(公告)号:CN112733654A
公开(公告)日:2021-04-30
申请号:CN202011617772.1
申请日:2020-12-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06K9/00 , G06F40/211 , G06F40/30 , G06K9/62 , G06F16/78 , G06F16/783 , G06N3/04 , G06N3/08
Abstract: 说明书披露一种视频拆条的方法和装置。一种视频拆条的方法,包括:从待拆条的目标视频中提取出音频,并将所述音频转换为对应的文本;从所述文本中确定出若干条话题句;以各话题句为文本段落的起始句,将所述文本划分为若干文本段落;基于划分后得到的文本段落,将所述目标视频对应拆条为若干视频片段。
-
公开(公告)号:CN111738532B
公开(公告)日:2021-02-05
申请号:CN202010817707.7
申请日:2020-08-14
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种事件对对象影响度的获取方法和系统,其包括:获取目标事件;将所述目标事件加入事件图谱中,并将所述目标事件对应的事件节点与所述事件图谱中至少一个描述节点关联,获得更新后的事件图谱;所述事件图谱包括多个节点以及节点之间的边权;所述节点包括事件节点、对象节点以及描述节点;在所述更新后的事件图谱中选取与所述目标事件对应的事件节点的关联路径不超过预设长度的对象节点,作为候选对象节点;利用影响度预测模型至少基于所述目标事件与各候选节点对应的候选对象,获得所述目标事件对各候选对象的影响度预测值。
-
公开(公告)号:CN114998878B
公开(公告)日:2025-04-04
申请号:CN202210462326.0
申请日:2022-04-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V20/62 , G06V10/82 , G06N3/0455
Abstract: 本说明书实施例提供关键词识别方法以及装置,其中,关键词识别方法包括:获取目标视频的字幕向量,根据字幕向量,基于预设的疲劳度控制规则,识别目标关键词。实现了对字幕文本中目标关键词的自动识别,识别更为高效,并且由于疲劳度控制规则是基于字幕文本中关键词的预设分布信息设置得到的,所识别出来的目标关键词能够满足预设的分布条件,使得目标关键词更符合实际需求,在具体应用时识别结果更为准确。
-
公开(公告)号:CN112804580B
公开(公告)日:2023-01-20
申请号:CN202011622535.4
申请日:2020-12-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: H04N21/433 , H04N21/439 , H04N21/488 , G06F40/211 , G06F40/253 , G06F40/30 , G06V20/40
Abstract: 说明书披露一种视频打点的方法和装置。一种视频打点的方法,包括:从待打点的目标视频中提取出音频,并将所述音频转换为对应的文本;将所述文本划分为若干个文本段落;确定各文本段落的段落标题;基于划分后得到的文本段落确定所述目标视频的打点位置,以将所述目标视频划分为若干视频片段,并为所述视频片段添加对应文本段落的段落标题,以实现所述目标视频的打点。
-
-
-
-
-
-
-
-
-