-
公开(公告)号:CN112632961A
公开(公告)日:2021-04-09
申请号:CN202110240179.8
申请日:2021-03-04
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 吴颖婷
IPC: G06F40/205 , G06F40/30
Abstract: 本说明书实施例公开了基于上下文推理的自然语言理解处理方法、装置以及设备。方案包括:获取用户当前发言,以及多轮的历史对话信息;将用户当前发言和历史对话信息分句后,分别进行独立编码,得到各句子分别的语义表示向量;根据注意力机制对历史对话信息对应的语义表示向量综合地进行再映射处理,得到对应的加权表征向量;根据加权表征向量和用户当前发言对应的语义表示向量,预测用户当前发言的意图和槽位只与用户当前发言存在依赖关系,还是与历史对话信息之间存在依赖关系;若与历史对话信息之间存在依赖关系,则获取已为历史对话信息确定的意图和槽位,并据此确定用户当前发言的意图和槽位。
-
公开(公告)号:CN114925181B
公开(公告)日:2024-10-18
申请号:CN202210479364.7
申请日:2022-04-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/35 , G06F40/30
Abstract: 本说明书实施例提供了一种数据处理方法及装置、计算机存储介质及终端。该方法包括:获取目标语句对应的第一向量和目标语句的上文对应的第二向量之间的关联语义特征,并对关联语义特征进行分类处理,得到目标语句的目标信息的类型,其中,目标语句的目标信息的类型为与目标语句的上文相关或与目标语句相关。根据目标信息的类型,确定对目标语句的答复信息。
-
公开(公告)号:CN118569272A
公开(公告)日:2024-08-30
申请号:CN202410768227.4
申请日:2024-06-13
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 吴颖婷
IPC: G06F40/49 , G06F18/22 , G06N3/0455 , G06F16/38 , G06N5/022
Abstract: 本说明书实施例涉及一种构建语料库的方法及装置,所述方法包括:获取第一语料库,其中包含多个无标签语料,然后,获取目标语料及其对应的目标类别标签,将目标语料与第一语料库中的各个语料进行相似度匹配,得到相似度排名靠前的多个检索结果语料。接下来,根据目标语料、目标类别标签以及多个检索结果语料,确定提示文本;提示文本指示大语言模型以提示文本中的各个语料为示例,生成目标类别标签所指示的类别的语料。在得到提示文本后,将提示文本输入到大语言模型中,得到多个生成结果语料。最后,根据多个检索结果语料、多个生成结果语料以及目标类别标签,构建有标签的第二语料库。
-
公开(公告)号:CN112632961B
公开(公告)日:2021-06-18
申请号:CN202110240179.8
申请日:2021-03-04
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 吴颖婷
IPC: G06F40/205 , G06F40/30
Abstract: 本说明书实施例公开了基于上下文推理的自然语言理解处理方法、装置以及设备。方案包括:获取用户当前发言,以及多轮的历史对话信息;将用户当前发言和历史对话信息分句后,分别进行独立编码,得到各句子分别的语义表示向量;根据注意力机制对历史对话信息对应的语义表示向量综合地进行再映射处理,得到对应的加权表征向量;根据加权表征向量和用户当前发言对应的语义表示向量,预测用户当前发言的意图和槽位只与用户当前发言存在依赖关系,还是与历史对话信息之间存在依赖关系;若与历史对话信息之间存在依赖关系,则获取已为历史对话信息确定的意图和槽位,并据此确定用户当前发言的意图和槽位。
-
公开(公告)号:CN111368526B
公开(公告)日:2023-04-25
申请号:CN202010138420.1
申请日:2020-03-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/253 , G06F18/2411
Abstract: 本说明书实施例公开了一种序列标注方法。包括:获取待标注序列的第一向量表示以及第二向量表示。第一向量表示可以反映待标注序列的文本信息,第二向量表示可以反映待标注序列的标注信息。可以基于第一向量表示与第二向量表示,获取对应于待标注序列的初始表示。可以将初始表示输入至标注模型,确定对应于待标注序列的目标标注结果;标注模型为机器学习模型。本说明书实施例公开的方法,可以提高模型的精确率和提高召回率,以及在进行序列标注时代入更多的语法和语义信息。
-
公开(公告)号:CN114925181A
公开(公告)日:2022-08-19
申请号:CN202210479364.7
申请日:2022-04-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/35 , G06F40/30
Abstract: 本说明书实施例提供了一种数据处理方法及装置、计算机存储介质及终端。该方法包括:获取目标语句对应的第一向量和目标语句的上文对应的第二向量之间的关联语义特征,并对关联语义特征进行分类处理,得到目标语句的目标信息的类型,其中,目标语句的目标信息的类型为与目标语句的上文相关或与目标语句相关。根据目标信息的类型,确定对目标语句的答复信息。
-
公开(公告)号:CN111368526A
公开(公告)日:2020-07-03
申请号:CN202010138420.1
申请日:2020-03-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/253 , G06K9/62
Abstract: 本说明书实施例公开了一种序列标注方法。包括:获取待标注序列的第一向量表示以及第二向量表示。第一向量表示可以反映待标注序列的文本信息,第二向量表示可以反映待标注序列的标注信息。可以基于第一向量表示与第二向量表示,获取对应于待标注序列的初始表示。可以将初始表示输入至标注模型,确定对应于待标注序列的目标标注结果;标注模型为机器学习模型。本说明书实施例公开的方法,可以提高模型的精确率和提高召回率,以及在进行序列标注时代入更多的语法和语义信息。
-
-
-
-
-
-