-
公开(公告)号:CN111191413A
公开(公告)日:2020-05-22
申请号:CN201911393738.8
申请日:2019-12-30
Applicant: 北京航空航天大学
IPC: G06F40/117 , G06F40/211 , G06F40/253 , G06F40/289 , G06F40/295 , G06F16/33
Abstract: 本发明通过深度学习技术,针对新闻文本的要素标记问题设计了一种基于图排序模型的事件核心内容自动标记方法及应用该方法的设备和系统,该方法包括基于句法依存树的事件关键要素抽取及核心词标记、核心事件构建、事件核心句定位并输出标记文本三个基本步骤,对文本的核心句子和核心词进行标记,从而实现新闻文本标记过程中节约人工成本以及时间成本,节省资源的技术效果。
-
公开(公告)号:CN110032729A
公开(公告)日:2019-07-19
申请号:CN201910113193.4
申请日:2019-02-13
Applicant: 北京航空航天大学
Abstract: 本发明提出一种基于神经图灵机的自动摘要生成方法,包括以下步骤:步骤1,新闻中文语料库构建;步骤2,摘要生成模型训练;步骤3,采用神经图灵机解码,当编码器读取整个源文本之后,解码器部分形成文本摘要的单词序列。本发明使用自动摘要的方式将新闻的主要内容进行抽取,形成简短的容易理解的摘要内容,不需要人工提取语义特征,摆脱了对词性标注和语义分析等自然语言处理工具提取的特征的依赖。
-
公开(公告)号:CN111325571B
公开(公告)日:2023-08-18
申请号:CN201911396009.8
申请日:2019-12-30
Applicant: 北京航空航天大学
IPC: G06Q30/0282 , G06F18/214 , G06F18/24 , G06F16/35
Abstract: 一种多任务学习的商品评论标签自动生成方法、装置与系统,包括:步骤一:构建训练数据集合与数据预处理;步骤二:实现基于Transformer encoder的评论源文本特征编码器;步骤三:提取代表评论源文本整体内容的[cls]标签对于的隐状态向量用于情感分类任务;步骤四:基于Transformer decoder实现多任务的评论摘要生成器模型;步骤五:训练数据并根据联合loss函数进行训练调优,并实现模型封装与装置的接口实现;本发明避免采用抽取式的方式去生成评论标签,即不需要依赖句法结构的人工的规则集不能适合多个领域场景的缺点,又能保证标签生成的高效性,即只需要输入源文本,本发明装置能够自动产生标签。
-
公开(公告)号:CN113254632B
公开(公告)日:2022-07-22
申请号:CN202110437683.7
申请日:2021-04-22
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
Abstract: 本发明公开了基于事件检测技术的时间线摘要自动生成方法,包括:S10、将新闻文本集合进行聚类,得到新闻事件的子事件文档集合,每个子事件文档集合对应一个子事件;S20、获取每个子事件文档集合的摘要;S30、对所述子事件进行筛选,自动确定时间线摘要长度L′,以及对应的L′个子事件;S40、获取所述L′个子事件对应的子事件文档集合的摘要,按照日期先后顺序对所述摘要进行排序,输出带有时间戳的摘要序列。以及,基于事件检测技术的时间线摘要自动生成装置,电子设备和存储介质。本发明具有能自动确定时间线摘要的长度,灵活性强,能够处理动态变化的新闻事件等优点。
-
公开(公告)号:CN111191462B
公开(公告)日:2022-02-22
申请号:CN201911396048.8
申请日:2019-12-30
Applicant: 北京航空航天大学
Abstract: 本发明涉及一种基于链路预测实现跨语言知识空间实体对齐方法和系统,其通过跨语言知识空间三元组融合、知识空间表示学习、预测新对齐实体对、自学习添加新的训练数据四个步骤生成经过预测的实体对,针对少量的训练语料,设计简单基于链路预测的方法预测新的实体对,进行跨语言知识空间融合,在此基础上提高两个知识空间中数据融合中,判断跨语言知识空间的实体对是否是同一个实体的效率,方法模型的设计较为轻便,且其节约了标注的人力。
-
公开(公告)号:CN113254632A
公开(公告)日:2021-08-13
申请号:CN202110437683.7
申请日:2021-04-22
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
Abstract: 本发明公开了基于事件检测技术的时间线摘要自动生成方法,包括:S10、将新闻文本集合进行聚类,得到新闻事件的子事件文档集合,每个子事件文档集合对应一个子事件;S20、获取每个子事件文档集合的摘要;S30、对所述子事件进行筛选,自动确定时间线摘要长度L′,以及对应的L′个子事件;S40、获取所述L′个子事件对应的子事件文档集合的摘要,按照日期先后顺序对所述摘要进行排序,输出带有时间戳的摘要序列。以及,基于事件检测技术的时间线摘要自动生成装置,电子设备和存储介质。本发明具有能自动确定时间线摘要的长度,灵活性强,能够处理动态变化的新闻事件等优点。
-
公开(公告)号:CN111191471A
公开(公告)日:2020-05-22
申请号:CN201911393679.4
申请日:2019-12-30
Applicant: 北京航空航天大学
IPC: G06F40/58 , G06F40/295 , G06F16/36
Abstract: 本发明公开了基于实体序列编码的知识图谱融合方法,所述方法包括:步骤一:知识图谱实体表示学习;步骤二:选择路径编码和对齐模型;步骤三:跨语言实体对齐模型,其中,在源语言知识图谱空间中,针对其中的一个实体,构建与其他种子实体的2跳序列,在目标语言知识图谱空间中构建可能与之对应的序列,找出概率最高的对齐序列,然后从对齐序列中找到同位置的节点,作为该节点的对齐节点;步骤四:添加新的候选种子节点;本发明针对现有技术中深度学习模型训练语料不足的问题,提出了基于实体路径表示学习的方法。
-
公开(公告)号:CN109977219A
公开(公告)日:2019-07-05
申请号:CN201910207415.9
申请日:2019-03-19
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
Abstract: 本发明公开了基于启发式规则的文本摘要自动生成方法,包括:S1、以文本的段落、句子顺序作为启发式语序,将新闻正文分为开始段落、中间段落和结尾段落,并以句子和片段为粒度对各段落进行启发式分割;S2、先以句子为粒度,分别抽取各段落的目标句子,得到各段落的句子摘要集合,再以所述句子摘要集合中的片段为粒度,分别抽取各段落的目标片段,得到各段落的片段摘要集合;S3、去除所述片段摘要集合中的冗余片段,将筛选出的片段按照片段出现的顺序组合,生成文本摘要。以及,基于启发式规则的文本摘要自动生成装置。采用本发明的方法生成的文本摘要的句子组织连贯性好,可读性强。
-
公开(公告)号:CN109885673A
公开(公告)日:2019-06-14
申请号:CN201910112890.8
申请日:2019-02-13
Applicant: 北京航空航天大学
Abstract: 本发明提出了一种基于预训练语言模型的自动文本摘要方法,所述方法使用超大规模无监督中文语料训练复杂的深层语言模型,该模型低层网络结构可以提取保留文本的语法和结构信息,高层网络结构可以提取保留文本的语义和上下文信息,从而为自动文本摘要任务提供更加丰富的文本特征和语义信息;将预训练语言模型与编码器(Encoder)结合起来实现,充分利用预训练语言模型中的文本特征和语义信息,提供更好的语义压缩效果,提升自动文本摘要的性能;将预训练语言模型与解码器(Decoder)结合起来,在文本生成过程中不仅考虑原文中的语义,还考虑到词汇本身的语义信息,提升生成文本的可读性和与原文的关联性,提升自动文本摘要的性能。
-
公开(公告)号:CN109885670A
公开(公告)日:2019-06-14
申请号:CN201910112764.2
申请日:2019-02-13
Applicant: 北京航空航天大学
IPC: G06F16/332 , G06F16/36
Abstract: 本发明提出一种面向话题文本的交互注意力编码情感分析方法,步骤1,对话题文本进行预处理;步骤2,进行话题文本编码;步骤3,话题对象与话题文本的交互式注意力机制编码;步骤4,情感分类模型训练;步骤5,情感预测,对话题对象进行情感分析,得到适应模型装置参数的最佳情感类别。
-
-
-
-
-
-
-
-
-