-
公开(公告)号:CN119961385A
公开(公告)日:2025-05-09
申请号:CN202311452517.X
申请日:2023-11-03
Applicant: 电子科技大学长三角研究院(湖州)
IPC: G06F16/3329 , G06F16/334 , G06F16/353 , G06F40/205 , G06F18/2415 , G06N3/045 , G06N3/08
Abstract: 对话系统中按照建模方式可以分为两种:基于流水线的方法和基于端到端的方法。然而在基于流水线的方法中,各个模块只能分别优化,存在误差叠加问题,基于端到端的方法利用历史对话来直接生成系统回复。但由于基于端到端方法的对话系统没有全面考虑知识库中的信息,限制了任务型对话系统的效果。本文提出一种基于预训练自回归语言模型的任务型问答系统,将传统的基于流水线的对话系统中的各个模块集成到了单一的自回归语言模型中,并采用自回归语言模型的解析方式依次生成各个模块的结果,直到生成最终的系统回复。
-
公开(公告)号:CN114610874A
公开(公告)日:2022-06-10
申请号:CN202111471316.5
申请日:2021-12-04
Applicant: 电子科技大学长三角研究院(湖州)
IPC: G06F16/35
Abstract: 本发明公开了一种基于BERT模型的安全事故标签分类方法,属于自然语言处理领域。本发明首先进行对文本进行预处理,精简文本,提高处理效率;然后使用基于BERT预训练模型实现抽取式文本摘要,使用NEZHA预训练语言模型及PGN模型实现生成式文本摘要;最后通过ALBERT训练模型,借助迁移学习的思想进行多标签多任务分类。可对安全事故及原因分类,为安全生产监管、事故隐患排查和分析奠定基础,实现安全生产事故分类水平的提升。
-
公开(公告)号:CN114691858A
公开(公告)日:2022-07-01
申请号:CN202210250558.X
申请日:2022-03-15
Applicant: 电子科技大学
IPC: G06F16/34 , G06F16/35 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明提出了一种基于改进的UNILM摘要生成方法,针对生成式摘要算法现存的问题,如生成细节不准确,语义不通顺的问题,选用在语义特征提取,对文章的理解上优于传统RNN、LSTM的基于Transformer的UNILM模型,融合COPY机制来改善,并且利用稀疏的softmax替代传统softmax,以避免传统softmax过度学习的问题。最后在模型整体损失函数加入coverage损失,达到避免生成重复结果的目的。
-
公开(公告)号:CN114625881A
公开(公告)日:2022-06-14
申请号:CN202111471322.0
申请日:2021-12-04
Applicant: 电子科技大学长三角研究院(湖州)
Abstract: 本发明提出一种基于ERP‑GAT的经济领域知识图谱补全算法。ERP‑GAT算法采用编码器‑解码器结构,编码器引入图注意力机制,输入实体嵌入矩阵和关系嵌入矩阵,计算每一个目标实体相邻的三元组的注意力分数,并更新嵌入矩阵,能够获取给定实体或节点周围的多跳关系、获取给定实体附近的丰富的语义信息和关系中所扮演的角色、对现有的知识在语义上相似的关系群进行巩固,解码器使用ConvKB模型,使用卷积层得到评分函数来分析在每一个维度上的全局嵌入特性并概括ERP‑GAT模型中的过渡特性。最终在标准数据集FB15K237的五项指标和NELL‑995的四项指标上相较其他现有算法有显著提升,取得了知识图谱补全任务的最佳效果。
-
公开(公告)号:CN114722194B
公开(公告)日:2023-05-09
申请号:CN202210250569.8
申请日:2022-03-15
Applicant: 电子科技大学
IPC: G06F16/35 , G06F16/34 , G06F40/211 , G06F40/289 , G06F40/30 , G06F40/216
Abstract: 本发明提供了一种基于摘要生成算法的突发事件时间序列自动构建的方法,将事件文档输入后,即可获得事件发生经过的详细且简洁的描述。该方法通过文本聚类、摘要生成技术以及消除冗余等自然语言处理技术,将互联网上繁杂冗长的事件报道,以简练的且有时间逻辑组织的事件序列呈现给用户,极大地减少了用户了解某一事件消耗的时间和精力。因突发事件对人类社会通常有着直接的影响,所需时间成本小的事件时序信息,也更利于传播,利于群众了解状况的同时做好相应的举措。
-
公开(公告)号:CN115757717A
公开(公告)日:2023-03-07
申请号:CN202211368420.6
申请日:2022-11-03
Applicant: 电子科技大学长三角研究院(湖州)
IPC: G06F16/332 , G06F16/36 , G06F40/211 , G06N3/042
Abstract: 基于知识图谱的问答系统是问答系统中的一个热门分支,随着社会不断地进步发展,信息时代,人们获取的信息多而杂乱,从互联网上获取的信息往往缺乏精确性,基于知识图谱的问答系统就可以将杂乱繁多的信息整合起来,给出的具有语义理解智能程度高、回答准确性高结果。在已有的基于知识图谱问答系统中,在给定上下文的条件下,目前现有的方法,对于问答对使用语言模型处理,对于知识图谱使用图神经网络进行处理,并且相互之间不更新彼此的嵌入,也不做语义的对齐表示,问答对与知识图谱由于分开表示,限制了模型推理的能力,针对上述问题,本发明提出一种基于GAT‑KBD的医疗领域问答算法,将问答对和知识图谱的信息联合构建图谱,最终取得了更好的效果。
-
公开(公告)号:CN114691858B
公开(公告)日:2023-10-03
申请号:CN202210250558.X
申请日:2022-03-15
Applicant: 电子科技大学
IPC: G06F16/34 , G06F16/35 , G06F40/289 , G06N3/0455 , G06N3/047 , G06N3/048 , G06N3/08
Abstract: 本发明提出了一种基于改进的UNILM摘要生成方法,针对生成式摘要算法现存的问题,如生成细节不准确,语义不通顺的问题,选用在语义特征提取,对文章的理解上优于传统RNN、LSTM的基于Transformer的UNILM模型,融合COPY机制来改善,并且利用稀疏的softmax替代传统softmax,以避免传统softmax过度学习的问题。最后在模型整体损失函数加入coverage损失,达到避免生成重复结果的目的。
-
公开(公告)号:CN114722194A
公开(公告)日:2022-07-08
申请号:CN202210250569.8
申请日:2022-03-15
Applicant: 电子科技大学
IPC: G06F16/35 , G06F16/34 , G06F40/211 , G06F40/289 , G06F40/30 , G06F40/216
Abstract: 本发明提供了一种基于摘要生成算法的突发事件时间序列自动构建的方法,将事件文档输入后,即可获得事件发生经过的详细且简洁的描述。该方法通过文本聚类、摘要生成技术以及消除冗余等自然语言处理技术,将互联网上繁杂冗长的事件报道,以简练的且有时间逻辑组织的事件序列呈现给用户,极大地减少了用户了解某一事件消耗的时间和精力。因突发事件对人类社会通常有着直接的影响,所需时间成本小的事件时序信息,也更利于传播,利于群众了解状况的同时做好相应的举措。
-
-
-
-
-
-
-