-
公开(公告)号:CN115034229B
公开(公告)日:2025-03-14
申请号:CN202210779228.X
申请日:2022-07-01
Applicant: 电子科技大学
IPC: G06F40/30 , G06F40/289 , G06F40/211 , G06N3/0455 , G06N3/08
Abstract: 本发明提出了一种基于信息抽取和图模型的法律长文本相似度计算方法,所述方法包括以下步骤:从法律文本中抽取出实体和行为;用文本分类从行为中筛选出过错行为;将两个长文本中抽取出的实体和过错行为构成图模型;根据图模型中的结构和语义信息求出两个长文本的相似度。类案类判的目的为法官手头正在处理的案件寻找相似甚至相同的案件,提高判案的速度和准确性。本发明旨在更好地求解法律案件之间的相似度,解决传统方法中无法抓住案件要点的问题,为实现类案检索提供算法基础。
-
公开(公告)号:CN114637827A
公开(公告)日:2022-06-17
申请号:CN202111471323.5
申请日:2021-12-04
Applicant: 电子科技大学长三角研究院(湖州)
IPC: G06F16/332 , G06F16/951 , G06K9/62 , G06N3/04 , G06N3/08 , G06Q40/04
Abstract: 本发明公开了一种基于图神经网络的碳交易事件抽取方法,属于自然语言处理技术领域。本发明首先定向爬取中文碳交易文本,对文本进行清洗和预处理,获取相应的数据集;然后通过预处理模型BERT和BiGRU网络,融合词性特征,提取长距离语义信息,获得词级特征和句级特征;再者,通过CRF模型提取句子中的候选触发词和候选论元;然后基于候选事件元素构建图神经网络节点,根据句级特征相似度构建图神经网络边,加入多头注意力机制,通过图神经网络学习事件触发词和事件论元的依赖关系;最后基于全连接层和Sigmoid层分类事件候选元素。本发明针对中国新兴的碳交易市场的非结构化信息,可理解深层语义信息,关注句子中重要的词,有效提取结构化的碳交易事件信息。
-
公开(公告)号:CN114722194B
公开(公告)日:2023-05-09
申请号:CN202210250569.8
申请日:2022-03-15
Applicant: 电子科技大学
IPC: G06F16/35 , G06F16/34 , G06F40/211 , G06F40/289 , G06F40/30 , G06F40/216
Abstract: 本发明提供了一种基于摘要生成算法的突发事件时间序列自动构建的方法,将事件文档输入后,即可获得事件发生经过的详细且简洁的描述。该方法通过文本聚类、摘要生成技术以及消除冗余等自然语言处理技术,将互联网上繁杂冗长的事件报道,以简练的且有时间逻辑组织的事件序列呈现给用户,极大地减少了用户了解某一事件消耗的时间和精力。因突发事件对人类社会通常有着直接的影响,所需时间成本小的事件时序信息,也更利于传播,利于群众了解状况的同时做好相应的举措。
-
公开(公告)号:CN115034229A
公开(公告)日:2022-09-09
申请号:CN202210779228.X
申请日:2022-07-01
Applicant: 电子科技大学
IPC: G06F40/30 , G06F40/289 , G06F40/211 , G06N3/04 , G06N3/08
Abstract: 本发明提出了一种基于信息抽取和图模型的法律长文本相似度计算方法,所述方法包括以下步骤:从法律文本中抽取出实体和行为;用文本分类从行为中筛选出过错行为;将两个长文本中抽取出的实体和过错行为构成图模型;根据图模型中的结构和语义信息求出两个长文本的相似度。类案类判的目的为法官手头正在处理的案件寻找相似甚至相同的案件,提高判案的速度和准确性。本发明旨在更好地求解法律案件之间的相似度,解决传统方法中无法抓住案件要点的问题,为实现类案检索提供算法基础。
-
公开(公告)号:CN114691858A
公开(公告)日:2022-07-01
申请号:CN202210250558.X
申请日:2022-03-15
Applicant: 电子科技大学
IPC: G06F16/34 , G06F16/35 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明提出了一种基于改进的UNILM摘要生成方法,针对生成式摘要算法现存的问题,如生成细节不准确,语义不通顺的问题,选用在语义特征提取,对文章的理解上优于传统RNN、LSTM的基于Transformer的UNILM模型,融合COPY机制来改善,并且利用稀疏的softmax替代传统softmax,以避免传统softmax过度学习的问题。最后在模型整体损失函数加入coverage损失,达到避免生成重复结果的目的。
-
公开(公告)号:CN114625881A
公开(公告)日:2022-06-14
申请号:CN202111471322.0
申请日:2021-12-04
Applicant: 电子科技大学长三角研究院(湖州)
Abstract: 本发明提出一种基于ERP‑GAT的经济领域知识图谱补全算法。ERP‑GAT算法采用编码器‑解码器结构,编码器引入图注意力机制,输入实体嵌入矩阵和关系嵌入矩阵,计算每一个目标实体相邻的三元组的注意力分数,并更新嵌入矩阵,能够获取给定实体或节点周围的多跳关系、获取给定实体附近的丰富的语义信息和关系中所扮演的角色、对现有的知识在语义上相似的关系群进行巩固,解码器使用ConvKB模型,使用卷积层得到评分函数来分析在每一个维度上的全局嵌入特性并概括ERP‑GAT模型中的过渡特性。最终在标准数据集FB15K237的五项指标和NELL‑995的四项指标上相较其他现有算法有显著提升,取得了知识图谱补全任务的最佳效果。
-
公开(公告)号:CN114691858B
公开(公告)日:2023-10-03
申请号:CN202210250558.X
申请日:2022-03-15
Applicant: 电子科技大学
IPC: G06F16/34 , G06F16/35 , G06F40/289 , G06N3/0455 , G06N3/047 , G06N3/048 , G06N3/08
Abstract: 本发明提出了一种基于改进的UNILM摘要生成方法,针对生成式摘要算法现存的问题,如生成细节不准确,语义不通顺的问题,选用在语义特征提取,对文章的理解上优于传统RNN、LSTM的基于Transformer的UNILM模型,融合COPY机制来改善,并且利用稀疏的softmax替代传统softmax,以避免传统softmax过度学习的问题。最后在模型整体损失函数加入coverage损失,达到避免生成重复结果的目的。
-
公开(公告)号:CN114722194A
公开(公告)日:2022-07-08
申请号:CN202210250569.8
申请日:2022-03-15
Applicant: 电子科技大学
IPC: G06F16/35 , G06F16/34 , G06F40/211 , G06F40/289 , G06F40/30 , G06F40/216
Abstract: 本发明提供了一种基于摘要生成算法的突发事件时间序列自动构建的方法,将事件文档输入后,即可获得事件发生经过的详细且简洁的描述。该方法通过文本聚类、摘要生成技术以及消除冗余等自然语言处理技术,将互联网上繁杂冗长的事件报道,以简练的且有时间逻辑组织的事件序列呈现给用户,极大地减少了用户了解某一事件消耗的时间和精力。因突发事件对人类社会通常有着直接的影响,所需时间成本小的事件时序信息,也更利于传播,利于群众了解状况的同时做好相应的举措。
-
-
-
-
-
-
-