-
公开(公告)号:CN111191471B
公开(公告)日:2022-06-28
申请号:CN201911393679.4
申请日:2019-12-30
Applicant: 北京航空航天大学
IPC: G06F40/58 , G06F40/295 , G06F16/36
Abstract: 本发明公开了基于实体序列编码的知识图谱融合方法,所述方法包括:步骤一:知识图谱实体表示学习;步骤二:选择路径编码和对齐模型;步骤三:跨语言实体对齐模型,其中,在源语言知识图谱空间中,针对其中的一个实体,构建与其他种子实体的2跳序列,在目标语言知识图谱空间中构建可能与之对应的序列,找出概率最高的对齐序列,然后从对齐序列中找到同位置的节点,作为该节点的对齐节点;步骤四:添加新的候选种子节点;本发明针对现有技术中深度学习模型训练语料不足的问题,提出了基于实体路径表示学习的方法。
-
公开(公告)号:CN113312470B
公开(公告)日:2022-05-31
申请号:CN202110589943.2
申请日:2021-05-28
Applicant: 北京航空航天大学
IPC: G06F16/335 , G06F16/35 , G06F40/14 , G06F40/194 , G06F40/211 , G06F40/258 , G06F40/295 , G06F40/30 , G06F21/62 , G16H50/70 , G06N3/04 , G06N3/08
Abstract: 本发明通过人工智能领域的方法,实现了一种基于匿名化隐私保护技术的医疗事件抽取方法。由事件检测模型和事件抽取模型构成;事件检测模型输入已发布新闻的概要信息或新闻正文的第一段落作为与标题进行信息交互的摘要文本,使用双向注意力流获取标题中的单词与摘要中文本的关联信息,之后通过单词嵌入层、双向注意力机制层、模型层、输出层的模型结构,采用Bi‑LSTM模型方法得到最终的分类标签;事件抽取模型通过抽取时间、地点、人物、组织机构、v‑n词对五项参数的方式结构化表示从事件中提取的有效信息。最终实现了能够克服事件句中可能存在的实体语义信息不明的情况,以及利用语义依存树学习文本结构信息来弥补文本中实体含义部分缺失的问题的方法。
-
公开(公告)号:CN113312464B
公开(公告)日:2022-05-31
申请号:CN202110589755.X
申请日:2021-05-28
Applicant: 北京航空航天大学
IPC: G06F16/332 , G06F16/33 , G06F16/335 , G06F16/35 , G06F16/36 , G06F40/186 , G06F40/253 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明通过人工智能领域的方法,实现了一种基于对话状态追踪技术的事件抽取方法。方法整体由事件分类、序列问题生成模型和论元抽取模型三部分组成;事件分类检测输入文本是否是事件,如果文本不包含事件,则输出NULL,否则分类文本所属的事件类型;序列问题生成模型根据事件类型和已经预测的置信度高的论元结果自动生成问题;论元抽取模型将所述序列问题生成模型生成的问题和输入文本作为输入来预测论元位置,然后采用标签对齐机制将预测的论元中置信度高的论元加入训练集中。这一方法通过三部分模型,能对所有参数的预测结果和高置信度结果进行反馈;提取两个任务之间的共同信息和模式,并利用所学习到的语法和语义知识标记;并充分利用论元之间的相关性。
-
公开(公告)号:CN111191462A
公开(公告)日:2020-05-22
申请号:CN201911396048.8
申请日:2019-12-30
Applicant: 北京航空航天大学
Abstract: 本发明涉及一种基于链路预测实现跨语言知识空间实体对齐方法和系统,其通过跨语言知识空间三元组融合、知识空间表示学习、预测新对齐实体对、自学习添加新的训练数据四个步骤生成经过预测的实体对,针对少量的训练语料,设计简单基于链路预测的方法预测新的实体对,进行跨语言知识空间融合,在此基础上提高两个知识空间中数据融合中,判断跨语言知识空间的实体对是否是同一个实体的效率,方法模型的设计较为轻便,且其节约了标注的人力。
-
公开(公告)号:CN111191413A
公开(公告)日:2020-05-22
申请号:CN201911393738.8
申请日:2019-12-30
Applicant: 北京航空航天大学
IPC: G06F40/117 , G06F40/211 , G06F40/253 , G06F40/289 , G06F40/295 , G06F16/33
Abstract: 本发明通过深度学习技术,针对新闻文本的要素标记问题设计了一种基于图排序模型的事件核心内容自动标记方法及应用该方法的设备和系统,该方法包括基于句法依存树的事件关键要素抽取及核心词标记、核心事件构建、事件核心句定位并输出标记文本三个基本步骤,对文本的核心句子和核心词进行标记,从而实现新闻文本标记过程中节约人工成本以及时间成本,节省资源的技术效果。
-
公开(公告)号:CN110032729A
公开(公告)日:2019-07-19
申请号:CN201910113193.4
申请日:2019-02-13
Applicant: 北京航空航天大学
Abstract: 本发明提出一种基于神经图灵机的自动摘要生成方法,包括以下步骤:步骤1,新闻中文语料库构建;步骤2,摘要生成模型训练;步骤3,采用神经图灵机解码,当编码器读取整个源文本之后,解码器部分形成文本摘要的单词序列。本发明使用自动摘要的方式将新闻的主要内容进行抽取,形成简短的容易理解的摘要内容,不需要人工提取语义特征,摆脱了对词性标注和语义分析等自然语言处理工具提取的特征的依赖。
-
公开(公告)号:CN111325571B
公开(公告)日:2023-08-18
申请号:CN201911396009.8
申请日:2019-12-30
Applicant: 北京航空航天大学
IPC: G06Q30/0282 , G06F18/214 , G06F18/24 , G06F16/35
Abstract: 一种多任务学习的商品评论标签自动生成方法、装置与系统,包括:步骤一:构建训练数据集合与数据预处理;步骤二:实现基于Transformer encoder的评论源文本特征编码器;步骤三:提取代表评论源文本整体内容的[cls]标签对于的隐状态向量用于情感分类任务;步骤四:基于Transformer decoder实现多任务的评论摘要生成器模型;步骤五:训练数据并根据联合loss函数进行训练调优,并实现模型封装与装置的接口实现;本发明避免采用抽取式的方式去生成评论标签,即不需要依赖句法结构的人工的规则集不能适合多个领域场景的缺点,又能保证标签生成的高效性,即只需要输入源文本,本发明装置能够自动产生标签。
-
公开(公告)号:CN111191462B
公开(公告)日:2022-02-22
申请号:CN201911396048.8
申请日:2019-12-30
Applicant: 北京航空航天大学
Abstract: 本发明涉及一种基于链路预测实现跨语言知识空间实体对齐方法和系统,其通过跨语言知识空间三元组融合、知识空间表示学习、预测新对齐实体对、自学习添加新的训练数据四个步骤生成经过预测的实体对,针对少量的训练语料,设计简单基于链路预测的方法预测新的实体对,进行跨语言知识空间融合,在此基础上提高两个知识空间中数据融合中,判断跨语言知识空间的实体对是否是同一个实体的效率,方法模型的设计较为轻便,且其节约了标注的人力。
-
公开(公告)号:CN111191471A
公开(公告)日:2020-05-22
申请号:CN201911393679.4
申请日:2019-12-30
Applicant: 北京航空航天大学
IPC: G06F40/58 , G06F40/295 , G06F16/36
Abstract: 本发明公开了基于实体序列编码的知识图谱融合方法,所述方法包括:步骤一:知识图谱实体表示学习;步骤二:选择路径编码和对齐模型;步骤三:跨语言实体对齐模型,其中,在源语言知识图谱空间中,针对其中的一个实体,构建与其他种子实体的2跳序列,在目标语言知识图谱空间中构建可能与之对应的序列,找出概率最高的对齐序列,然后从对齐序列中找到同位置的节点,作为该节点的对齐节点;步骤四:添加新的候选种子节点;本发明针对现有技术中深度学习模型训练语料不足的问题,提出了基于实体路径表示学习的方法。
-
公开(公告)号:CN109885673A
公开(公告)日:2019-06-14
申请号:CN201910112890.8
申请日:2019-02-13
Applicant: 北京航空航天大学
Abstract: 本发明提出了一种基于预训练语言模型的自动文本摘要方法,所述方法使用超大规模无监督中文语料训练复杂的深层语言模型,该模型低层网络结构可以提取保留文本的语法和结构信息,高层网络结构可以提取保留文本的语义和上下文信息,从而为自动文本摘要任务提供更加丰富的文本特征和语义信息;将预训练语言模型与编码器(Encoder)结合起来实现,充分利用预训练语言模型中的文本特征和语义信息,提供更好的语义压缩效果,提升自动文本摘要的性能;将预训练语言模型与解码器(Decoder)结合起来,在文本生成过程中不仅考虑原文中的语义,还考虑到词汇本身的语义信息,提升生成文本的可读性和与原文的关联性,提升自动文本摘要的性能。
-
-
-
-
-
-
-
-
-