-
公开(公告)号:CN111325254A
公开(公告)日:2020-06-23
申请号:CN202010089190.4
申请日:2020-02-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06K9/62
Abstract: 本说明书实施例提供的构建条件关系网络、利用所构建的条件关系网络进行条件业务处理的方法及装置,将分布式架构引入条件关系网络的数据处理过程。在构建条件关系网络时,以各个业务状态的属性类别的联合概率分布为基础,在更新初始关系网络中的连接边时,拆分出多个局部网络进行分布式数据处理,使得单个任务处理的数据仅包括联合概率分布数据及以一个节点为基准的局部网络数据。进一步地,在利用条件关系网络进行业务数据处理过程中,也基于分布式数据处理的构思,针对待预测节点进行属性类别采样的多个子任务,将各个子任务分发给多个分布式设备进行处理。这种构思可以减少单任务的数据处理量,解决条件关系网络应用实践中的数据量瓶颈问题。
-
公开(公告)号:CN111241851A
公开(公告)日:2020-06-05
申请号:CN202010329730.1
申请日:2020-04-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/30 , G06F40/289 , G06K9/62
Abstract: 本说明书提供一种语义相似度确定方法、装置及处理设备,预先建立的语义相似度模型从两个不同的角度处理句子对,既考虑了文本句子的维度,又结合了文本单词级交叉矩阵的角度。在需要对待处理文本进行语义相似度的计算时,可以直接利用建立好的语义相似度模型中的语句语义确定子模型对待处理文本分别进行语义编码,将待处理文本分别转换为向量表示,基于转换后的向量对待处理文本进行相似度计算。在确保语义相似度计算效率的基础上,提高了语义相似度计算的准确性。
-
公开(公告)号:CN112199952B
公开(公告)日:2021-03-23
申请号:CN202011397544.8
申请日:2020-12-04
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/289 , G06F40/284 , G06F40/205 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例公开了一种分词方法、多模式分词模型和系统。该方法包括:获取待处理文本;利用多模式分词模型对所述待处理文本进行以下处理,以确定对所述待处理文本的分词结果:通过特征提取层处理所述待处理文本,获得对应于所述待处理文本的特征序列;基于所述待处理文本所属的领域类型,通过对应所述领域类型的至少一个映射层处理所述特征序列,获得至少一个映射特征;通过预测层基于所述至少一个映射特征确定对所述待处理文本的所述分词结果。
-
公开(公告)号:CN112199952A
公开(公告)日:2021-01-08
申请号:CN202011397544.8
申请日:2020-12-04
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/289 , G06F40/284 , G06F40/205 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例公开了一种分词方法、多模式分词模型和系统。该方法包括:获取待处理文本;利用多模式分词模型对所述待处理文本进行以下处理,以确定对所述待处理文本的分词结果:通过特征提取层处理所述待处理文本,获得对应于所述待处理文本的特征序列;基于所述待处理文本所属的领域类型,通过对应所述领域类型的至少一个映射层处理所述特征序列,获得至少一个映射特征;通过预测层基于所述至少一个映射特征确定对所述待处理文本的所述分词结果。
-
公开(公告)号:CN111538825B
公开(公告)日:2020-10-16
申请号:CN202010632352.4
申请日:2020-07-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/31 , G06F16/35 , G06F16/36 , G06F40/30
Abstract: 本说明书实施例公开了一种知识问答方法、装置、系统、设备及存储介质,包括:获取用户问句;对用户问句和预先构建的结构化数据中结构部分进行编码得到第一特征向量,从结构化数据上召回与用户问句相关的候选子图,并对候选子图进行编码得到第二特征向量;根据第一特征向量和第二特征向量进行针对用户问句的多任务分类,根据分类结果得到用户问句的答案内容。
-
公开(公告)号:CN111382257A
公开(公告)日:2020-07-07
申请号:CN202010470216.X
申请日:2020-05-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33 , G06N3/04
Abstract: 本说明书实施例公开了一种生成对话下文的方法及系统。所述方法包括:获取对话上文,根据所述对话上文获取与所述对话上文相关的至少一个知识文本,并生成所述至少一个知识文本对应的至少一个知识向量k1~km;所述知识文本存储在知识库中;根据至少一个所述知识向量k1~km和当前时刻的解码隐藏状态St,使用第一注意力模型生成当前时刻的知识融合向量 ;基于所述当前时刻的知识融合向量、当前时刻的上下文向量 以及所述当前时刻的解码隐藏状语组态S成t,所生述成对当话前下时文刻,所的述对y话1表下示文t词=1时语的yt;对y1话~y下t的文对词话语下。文词
-
公开(公告)号:CN115048486B
公开(公告)日:2024-05-31
申请号:CN202210580427.8
申请日:2022-05-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33 , G06F16/335 , G06F16/35
Abstract: 本申请公开了一种事件抽取方法、装置、计算机程序产品、存储介质及设备,其中方法包括:识别目标文本中的至少一个触发词,获取至少一个触发词分别对应的触发词向量,基于各触发词对应的触发词向量、各触发词对应的事件类型向量以及各触发词对应的相对位置向量,在目标文本中确定与各触发词对应的事件类型相关联的要素词信息,要素词信息包括至少一个要素词中各要素词对应的位置信息和各要素词之间的要素关系,基于各要素词的位置信息以及各要素词之间的要素关系,生成目标文本对应的事件抽取结果,各触发词对应的事件类型向量表示目标触发词对应的事件类型,各触发词对应的相对位置向量表示目标文本中各单词和各触发词之间的相对位置关系。
-
公开(公告)号:CN116304012A
公开(公告)日:2023-06-23
申请号:CN202211538156.6
申请日:2022-12-02
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35
Abstract: 本说明书实施例提供了一种大规模文本聚类方法及装置。该方法中包含粗聚类和二次精细聚类。首先,通过语义表示模型确定多条文本分别对应的语义向量;基于多条文本的语义向量,确定多条文本彼此之间的相似度矩阵。接着,在粗聚类阶段,从相似度矩阵中确定多条文本分别对应的相似度最大的M个相似文本,并在M个相似文本对应的相似度大于阈值时,将对应的文本作为筛选出的中心文本,以便快速地去除大量孤立噪点。然后,基于中心文本在相似度矩阵中对应的数据,得到候选类簇,并对存在交叉文本的候选类簇进行合并,之后再对合并后的类簇进行二次精细聚类。
-
公开(公告)号:CN112507074A
公开(公告)日:2021-03-16
申请号:CN202011436272.8
申请日:2020-07-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33 , G06F16/332 , G06F16/35 , G06F16/36 , G06N5/04
Abstract: 本说明书实施例提供一种机器阅读理解中的数值推理方法和装置。方法包括:获取当前问题和当前文本;确定当前问题和当前文本中包括的各实体和各数字,以及各数字分别对应的类型;构建关系网络图,包括对应于各实体的实体节点,和对应于各数字的数字节点,在相同类型的数字节点之间,以及具有预设关系的实体节点和数字节点之间,通过连接边形成邻居;确定当前问题对应的第一问题表征向量,以及关系网络图中各节点的初始表征向量;基于各节点的初始表征向量,对所述关系网络图中的各节点进行预定次数的迭代,以得到各节点的更新表征向量。能够提高机器阅读理解中的数值推理处理复杂问题的能力。
-
公开(公告)号:CN111400481A
公开(公告)日:2020-07-10
申请号:CN202010410108.3
申请日:2020-05-15
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332
Abstract: 本说明书实施例提供一种针对多轮对话生成回复语句的方法和装置,方法包括:获取历史上下文;对历史上下文基于注意力机制进行编码,得到历史上下文对应的上下文向量,以及历史上下文对应的第一分词序列的编码注意力分布;对候选知识集合中的各候选知识基于注意力机制进行编码,得到候选知识集合对应的知识融合向量,以及候选知识集合对应的第二分词序列的知识注意力分布;针对回复语句进行逐词预测,其中每次预测包括:对于扩充词表中每个候选词,得到将该候选词作为下一个词的预测概率;扩充词表包括,用于生成候选词的初始词表,第一分词序列中各分词,以及第二分词序列中各分词。在针对多轮对话生成回复语句时能够处理词汇不足单词。
-
-
-
-
-
-
-
-
-