-
公开(公告)号:CN118839691A
公开(公告)日:2024-10-25
申请号:CN202410798676.3
申请日:2024-06-20
Applicant: 北京工业大学
IPC: G06F40/279 , G06F40/284 , G06F40/30 , G06F40/211 , G06F16/33 , G06N3/042 , G06F18/213 , G06N3/08 , G06F17/16
Abstract: 本发明公开了一种基于伪孪生去噪网络的中文实体关系联合抽取方法,为弥补联合抽取任务对于语境信息和句法信息利用不充分问题,首先引入文本词性信息和依存句法信息进行先验特征学习,对生成的文本词性特征向量、文本语义特征向量和依存句法特征向量进行拼接和特征降维;将去噪门机制整合到孪生网络中,形成伪孪生网络,将特征降维后的特征向量分别输入到孪生网络和伪孪生网络中,对孪生网络获得的原始特征和伪孪生网络产生的去噪特征进行残差连接,形成伪孪生去噪网络,防止信息损失,并将其输入到关系导向网络执行联合抽取任务。通过伪孪生去噪网络可以很大程度上处理表示学习过程中产生的噪音特征,以此缓解一词多义和歧义问题造成的性能损失。
-
公开(公告)号:CN116127095A
公开(公告)日:2023-05-16
申请号:CN202310010370.2
申请日:2023-01-04
Applicant: 北京工业大学
IPC: G06F16/36 , G06F16/332 , G06F16/35 , G06F16/33 , G06F16/951 , G06N3/0455 , G06N3/08 , G06F40/289 , G06F40/284
Abstract: 本发明公开了一种序列模型与知识图谱结合的问答方法,包括:知识获取处理方法、知识图谱构建方法、模型构建方法、问题判断与答案生成方法。针对不同类型的数据集设计了相应的问答策略,从领域专业知识数据集构建“领域专业知识语义数据”,通过关键词提取和模板匹配获得知识图谱中的专业答案。从领域知识基本问答数据集构建“领域知识基本问答语义数据”,并使用句向量相似度算法获得领域知识聊天数据集的最佳答案,以训练Seq2seq模型,作为知识图谱的补充。结合上述问答策略,本方法既可以回答专业的领域知识,还可以回答日常聊天系统。该方法能够准确、高效地回答不同领域的问题,在一定程度上使得问答系统能够理解用户的意图,更加智能化。
-
公开(公告)号:CN119993533A
公开(公告)日:2025-05-13
申请号:CN202510067754.7
申请日:2025-01-16
Applicant: 北京工业大学
IPC: G16H50/70 , G16H10/60 , G16H50/20 , G06F16/36 , G06F16/9536 , G06N3/045 , G06N3/0442 , G06N3/084 , G06N5/022
Abstract: 本发明公开了一种基于社交媒体知识图谱嵌入的疾病识别预测方法,主要面向社交媒体场景下的特定疾病患者识别。为优化社交媒体用户自我报告知识图谱三元组的表示学习过程,设计基于双曲空间的知识嵌入优化算法,将ComplEx模型嵌入到双曲空间中,增强模型对具有层次结构的复杂数据的表征能力,并使用Riemannian梯度下降法对Poincaré球模型进行梯度更新,确保嵌入点始终处于有效区域中。基于此嵌入优化,在BERT+LSTM模型的基础上联合通道注意力机制和空间注意力机制将社交媒体用户自我报告文本信息与知识图谱信息进行知识融合,利用知识图谱中的外部信息增强模型的空间特征表达能力,从而提高对社交媒体中特定疾病患者用户的识别精度。
-
-