基于实体序列编码的知识图谱融合方法

    公开(公告)号:CN111191471B

    公开(公告)日:2022-06-28

    申请号:CN201911393679.4

    申请日:2019-12-30

    Abstract: 本发明公开了基于实体序列编码的知识图谱融合方法,所述方法包括:步骤一:知识图谱实体表示学习;步骤二:选择路径编码和对齐模型;步骤三:跨语言实体对齐模型,其中,在源语言知识图谱空间中,针对其中的一个实体,构建与其他种子实体的2跳序列,在目标语言知识图谱空间中构建可能与之对应的序列,找出概率最高的对齐序列,然后从对齐序列中找到同位置的节点,作为该节点的对齐节点;步骤四:添加新的候选种子节点;本发明针对现有技术中深度学习模型训练语料不足的问题,提出了基于实体路径表示学习的方法。

    一种基于对话状态追踪技术的事件抽取方法

    公开(公告)号:CN113312464B

    公开(公告)日:2022-05-31

    申请号:CN202110589755.X

    申请日:2021-05-28

    Abstract: 本发明通过人工智能领域的方法,实现了一种基于对话状态追踪技术的事件抽取方法。方法整体由事件分类、序列问题生成模型和论元抽取模型三部分组成;事件分类检测输入文本是否是事件,如果文本不包含事件,则输出NULL,否则分类文本所属的事件类型;序列问题生成模型根据事件类型和已经预测的置信度高的论元结果自动生成问题;论元抽取模型将所述序列问题生成模型生成的问题和输入文本作为输入来预测论元位置,然后采用标签对齐机制将预测的论元中置信度高的论元加入训练集中。这一方法通过三部分模型,能对所有参数的预测结果和高置信度结果进行反馈;提取两个任务之间的共同信息和模式,并利用所学习到的语法和语义知识标记;并充分利用论元之间的相关性。

    一种基于链路预测实现跨语言知识空间实体对齐方法及系统

    公开(公告)号:CN111191462A

    公开(公告)日:2020-05-22

    申请号:CN201911396048.8

    申请日:2019-12-30

    Abstract: 本发明涉及一种基于链路预测实现跨语言知识空间实体对齐方法和系统,其通过跨语言知识空间三元组融合、知识空间表示学习、预测新对齐实体对、自学习添加新的训练数据四个步骤生成经过预测的实体对,针对少量的训练语料,设计简单基于链路预测的方法预测新的实体对,进行跨语言知识空间融合,在此基础上提高两个知识空间中数据融合中,判断跨语言知识空间的实体对是否是同一个实体的效率,方法模型的设计较为轻便,且其节约了标注的人力。

    一种多任务学习的商品评论标签自动生成方法、装置及系统

    公开(公告)号:CN111325571B

    公开(公告)日:2023-08-18

    申请号:CN201911396009.8

    申请日:2019-12-30

    Abstract: 一种多任务学习的商品评论标签自动生成方法、装置与系统,包括:步骤一:构建训练数据集合与数据预处理;步骤二:实现基于Transformer encoder的评论源文本特征编码器;步骤三:提取代表评论源文本整体内容的[cls]标签对于的隐状态向量用于情感分类任务;步骤四:基于Transformer decoder实现多任务的评论摘要生成器模型;步骤五:训练数据并根据联合loss函数进行训练调优,并实现模型封装与装置的接口实现;本发明避免采用抽取式的方式去生成评论标签,即不需要依赖句法结构的人工的规则集不能适合多个领域场景的缺点,又能保证标签生成的高效性,即只需要输入源文本,本发明装置能够自动产生标签。

    一种基于链路预测实现跨语言知识空间实体对齐方法及系统

    公开(公告)号:CN111191462B

    公开(公告)日:2022-02-22

    申请号:CN201911396048.8

    申请日:2019-12-30

    Abstract: 本发明涉及一种基于链路预测实现跨语言知识空间实体对齐方法和系统,其通过跨语言知识空间三元组融合、知识空间表示学习、预测新对齐实体对、自学习添加新的训练数据四个步骤生成经过预测的实体对,针对少量的训练语料,设计简单基于链路预测的方法预测新的实体对,进行跨语言知识空间融合,在此基础上提高两个知识空间中数据融合中,判断跨语言知识空间的实体对是否是同一个实体的效率,方法模型的设计较为轻便,且其节约了标注的人力。

    基于实体序列编码的知识图谱融合方法

    公开(公告)号:CN111191471A

    公开(公告)日:2020-05-22

    申请号:CN201911393679.4

    申请日:2019-12-30

    Abstract: 本发明公开了基于实体序列编码的知识图谱融合方法,所述方法包括:步骤一:知识图谱实体表示学习;步骤二:选择路径编码和对齐模型;步骤三:跨语言实体对齐模型,其中,在源语言知识图谱空间中,针对其中的一个实体,构建与其他种子实体的2跳序列,在目标语言知识图谱空间中构建可能与之对应的序列,找出概率最高的对齐序列,然后从对齐序列中找到同位置的节点,作为该节点的对齐节点;步骤四:添加新的候选种子节点;本发明针对现有技术中深度学习模型训练语料不足的问题,提出了基于实体路径表示学习的方法。

    一种基于预训练语言模型的自动文本摘要方法

    公开(公告)号:CN109885673A

    公开(公告)日:2019-06-14

    申请号:CN201910112890.8

    申请日:2019-02-13

    Abstract: 本发明提出了一种基于预训练语言模型的自动文本摘要方法,所述方法使用超大规模无监督中文语料训练复杂的深层语言模型,该模型低层网络结构可以提取保留文本的语法和结构信息,高层网络结构可以提取保留文本的语义和上下文信息,从而为自动文本摘要任务提供更加丰富的文本特征和语义信息;将预训练语言模型与编码器(Encoder)结合起来实现,充分利用预训练语言模型中的文本特征和语义信息,提供更好的语义压缩效果,提升自动文本摘要的性能;将预训练语言模型与解码器(Decoder)结合起来,在文本生成过程中不仅考虑原文中的语义,还考虑到词汇本身的语义信息,提升生成文本的可读性和与原文的关联性,提升自动文本摘要的性能。

Patent Agency Ranking