-
公开(公告)号:CN111401076B
公开(公告)日:2023-04-25
申请号:CN202010272706.9
申请日:2020-04-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/30 , G06F40/289 , G06N3/044
Abstract: 本说明书一个或多个实施例提供一种文本的相似度确定方法、装置和电子设备;所述方法包括:获取第一文本和第二文本;根据所述第一文本和第二文本,得到对应于所述第一文本和所述第二文本的文本表示向量;根据所述第一文本和第二文本,确定共有单字表示向量和差异单字表示向量;其中,所述共有单字表示向量对应于在所述第一文本和所述第二文本中均存在的单字,所述差异单字表示向量对应于仅在所述第一文本和所述第二文本之一中存在的单字;根据所述文本表示向量、所述共有单字表示向量和所述差异单字表示向量,得到对应于所述第一文本和所述第二文本的文本特征向量;根据所述文本特征向量,确定所述第一文本和所述第二文本的相似度。
-
公开(公告)号:CN113010653B
公开(公告)日:2022-09-02
申请号:CN202110279376.0
申请日:2021-03-16
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F40/30 , G06F40/211 , G06K9/62 , G06N3/08 , G06N20/00
Abstract: 本说明书实施例公开了一种对话策略模型训练、对话的方法和系统。其中,对话策略模型训练方法包括:基于多轮历史对话,确定第一训练数据以及第二训练数据;使用第一训练数据对对话策略模型进行第一阶段训练,使得对话策略模型能够基于对话上文输出与之对应的对话策略,进而获得对话策略模型的第一模型参数;使用第二训练数据对经过第一阶段训练后的对话策略模型进行第二阶段训练,调整第一模型参数,使得对话策略模型基于对话上文输出的对话策略能够与预设对话目标适配,进而获得对话策略模型的第二模型参数。
-
公开(公告)号:CN113221555A
公开(公告)日:2021-08-06
申请号:CN202110493880.0
申请日:2021-05-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/289 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例公开了一种基于多任务模型的关键词识别方法、装置以及设备。方案包括:获取训练文本,为训练文本中的各字符分别标注第一标签,以表示对应的字符是否位于其所在词的起始位置或者终止位置;为训练文本中的各字符分别标注第二标签,以表示对应的字符所在词是否为关键词;根据第一标签确定第一训练任务,以及根据第二标签确定第二训练任务;将第一训练任务和第二训练任务进行联合训练,得到关键词识别模型;利用关键词识别模型,识别输入文本中的关键词。
-
公开(公告)号:CN113010653A
公开(公告)日:2021-06-22
申请号:CN202110279376.0
申请日:2021-03-16
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F40/30 , G06F40/211 , G06K9/62 , G06N3/08 , G06N20/00
Abstract: 本说明书实施例公开了一种对话策略模型训练、对话的方法和系统。其中,对话策略模型训练方法包括:基于多轮历史对话,确定第一训练数据以及第二训练数据;使用第一训练数据对对话策略模型进行第一阶段训练,使得对话策略模型能够基于对话上文输出与之对应的对话策略,进而获得对话策略模型的第一模型参数;使用第二训练数据对经过第一阶段训练后的对话策略模型进行第二阶段训练,调整第一模型参数,使得对话策略模型基于对话上文输出的对话策略能够与预设对话目标适配,进而获得对话策略模型的第二模型参数。
-
公开(公告)号:CN112100387A
公开(公告)日:2020-12-18
申请号:CN202011269071.3
申请日:2020-11-13
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种用于文本分类的神经网络系统的训练方法,该神经网络系统包括文本表征网络、特征提取层和分类网络。该训练方法包括:首先,获取训练文本集,该训练文本集对应K个类别;接着,针对该训练文本集中任一的第一训练文本,利用上述文本表征网络对其进行处理,得到第一文本向量;然后,利用上述特征提取层,将该第一文本向量分别与对应所述K个类别的K个类别特征向量进行组合操作,得到K个特征提取向量;再接着,基于该K个特征提取向量和上述分类网络,确定分类预测结果;再然后,基于该分类预测结果和上述第一训练文本的类别标签,训练上述神经网络系统。
-
公开(公告)号:CN111444329B
公开(公告)日:2020-10-09
申请号:CN202010533383.4
申请日:2020-06-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本说明书提出了一种智能对话方法、装置和电子设备,其中,上述方法包括:获取当前用户的提问语句,将所述提问语句输入至多个预置问答模型,得到对应的多条回答语句,其中,所述预置问答模型用于根据所述提问语句生成对应的回答语句;分别将每条所述回答语句和与所述当前用户对应的历史对话语句进行组合,得到对应的多个对话语句序列;将所述对话语句序列输入至预置输出模型进行计算,得到每个所述对话语句序列对应的置信度,根据所述置信度获得最终的回答语句。通过上述方法可以实现智能的对话,由此可以减少对人工标注数据的依赖,提高对话的效率,提升用户体验。
-
公开(公告)号:CN111538906A
公开(公告)日:2020-08-14
申请号:CN202010477510.3
申请日:2020-05-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F21/62 , G06F40/30 , G06N3/04
Abstract: 本说明书实施例提供一种基于隐私保护的信息推送方法和装置,可以用于在保护用户隐私数据的前提下,基于历史会话中的对象选择序列建立异构图,并根据异构图体现出的推送对象之间的深层关联关系,从多个候选推送对象中确定若干个目标对象进行信息推送。根据一个实施方式,可以获取当前会话中的对象选择序列,并添加目标项构成预测序列,接着,将预测序列中的各项基于异构图确定描述向量,再根据各个描述向量推测目标项的预测向量,之后根据预测向量和各个候选推送对象的描述向量的对比,为目标项确定多个目标对象。该实施方式可以提高信息推送的准确度。
-
公开(公告)号:CN111401928A
公开(公告)日:2020-07-10
申请号:CN202010252268.X
申请日:2020-04-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q30/00 , G06F16/33 , G06F40/289 , G06F40/30
Abstract: 本说明书实施例提供了利用图数据确定文本的语义相似度的构思,在该技术构思下,图数据中的节点对应语料库中的句子和词,相关联的句子和词、词和词之间通过连接边连接,各个节点对应有能够表达相应词或句子的语义信息的节点表达向量。在对图数据的数据预处理过程中,能够利用大量无监督数据构建图数据,来描述词和句子、词和词之间的关系,并通过少量有监督数据优化处理模型的模型参数,使得相似文本的向量表示可以相互影响,从而通过图数据对文本和词汇进行有效的向量表达。在确定文本的语义相似度时,通过图数据获取待确定语义相似度文本的向量,利用向量相似度确定文本语义相似度。如此,可以提高文本语义相似度的通用性、准确度、有效性。
-
公开(公告)号:CN111324722A
公开(公告)日:2020-06-23
申请号:CN202010409812.7
申请日:2020-05-15
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33
Abstract: 本说明书实施例提供一种训练词语权重模型的方法和系统。所述方法包括:获取多个文本对;判断所述文本对中两个文本之间是否匹配,得到匹配结果;基于所述匹配结果确定所述文本对中文本的词语的重要性标识,得到含有所述重要性标识的多个文本对;基于多个训练数据训练词语权重模型,所述训练数据来源于含有所述重要性标识的多个文本对中的文本。
-
公开(公告)号:CN120034707A
公开(公告)日:2025-05-23
申请号:CN202510238205.1
申请日:2025-02-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: H04N21/854 , H04N21/81 , H04N21/233 , H04N21/236 , H04N21/439
Abstract: 本说明书实施例提供了基于多模态控制的人体视频生成方法及装置。该方法包括:获取文本提示信息、音频驱动信号以及目标说话人的参考图像,所述文本提示信息包含用于对所述目标说话人进行动作提示的文本信息,所述音频驱动信号为包含语音内容的音频信息;基于所述文本提示信息和所述音频驱动信号,生成所述目标说话人的运动姿态表示信息,所述运动姿态表示信息用于表示所述目标说话人的运动姿态;基于所述参考图像、所述音频驱动信号和所述运动姿态表示信息,生成所述目标说话人的说话视频,所述说话视频中包含所述目标说话人表达所述语音内容时的身体运动。
-
-
-
-
-
-
-
-
-