一种基于异构事件图的子事件关系识别方法

    公开(公告)号:CN113326352B

    公开(公告)日:2022-05-24

    申请号:CN202110675339.1

    申请日:2021-06-18

    Abstract: 本发明公开一种基于异构事件图的子事件关系识别方法,包括以下步骤:采集文本,提取文本中的事件,识别事件连接,基于事件和事件连接建立异构初始事件图,转换异构初始事件图,构建异构事件图;基于预训练语言模型BERT,获得异构事件图中每个节点的节点表示,基于节点表示,获得异构事件图的输入特征;对异构事件图中每个节点创建混合跳邻域集,进行信息传播和聚合,获得异构图注意力机制模型;将待测事件对输入异构图注意力机制模型,预测待测事件对的子事件关系。本发明通过混合多种距离邻居的特征表示,聚合来自不同类型的邻居的信息,捕获输入事件对之间的潜在的上下位关系,提高利用异构事件图预测子事件关系的准确性。

    一种基于图增强预训练模型的事件预测方法

    公开(公告)号:CN114398500A

    公开(公告)日:2022-04-26

    申请号:CN202210112341.2

    申请日:2022-01-29

    Abstract: 本发明公开了一种基于图增强预训练模型的事件预测方法,包括:获取事件序列,对事件序列进行预训练获得若干个编码向量,并对若干个编码向量进行聚合,获得事件序列的表示向量;基于事件序列的表示向量,获取事件序列中任两个事件的邻接关系;获取事理图谱,基于事理图谱获取事件的逻辑关系;基于任两个事件的邻接关系和事件的逻辑关系完成事件预测。采用事理图谱作为模型学习事件间关系模式的知识库,事理图谱是描述事件及其逻辑关系的图谱,其知识将为事件预测任务提供有力支撑,将预训练语言模型与图结构信息预测进行融合,既能利用预训练模型中的丰富语言学知识,充分理解各个事件的语义,能通过学习事理图谱结构变量实现图结构信息的预测。

    一种基于文本的消费意图分析方法

    公开(公告)号:CN113095088A

    公开(公告)日:2021-07-09

    申请号:CN202110485144.0

    申请日:2021-04-30

    Abstract: 一种基于文本的消费意图分析方法,它属于消费意图分析技术领域。本发明解决了由于现有方法忽略了彼此相距较远的节点的结构相似性,导致对消费意图分析的准确度低的问题。本发明提出的技术将任务描述为一个异构图推理任务,以充分利用全局连接信息,使用节点聚合机制来捕获语义特征,使用元结构来显式地建模远距离节点之间的拓扑结构相似性,考虑了远距离节点之间的拓扑结构相似性后,可以大幅提高消费意图分析结果的准确度。本发明可以应用于消费意图分析。

    一种基于自训练与噪声模型的因果事件抽取方法

    公开(公告)号:CN111651983A

    公开(公告)日:2020-09-11

    申请号:CN202010397785.6

    申请日:2020-05-12

    Abstract: 一种基于自训练与噪声模型的因果事件抽取方法,本发明涉及因果事件抽取的方法。本发明的目的是解决现有基于深度学习模型的因果事件抽取方法在有标注数据不足的领域或场景中效果有限的问题。过程为:一、收集已标注的目标领域文本;二、计算一个向量表示;三、计算出概率最大的标签序列;四、训练三中的模型,并对二中的模型进行微调;五、得到大量自标注数据;六、为每个单词计算一个向量表示,计算单词序列生成每个可能的标签序列的概率;七、计算自标注文本中每个单词的噪声矩阵;八、得到由单词序列生成自标注标签序列的概率;九、使用一中有标注数据与五中自标注数据共同训练二、三、六、七中的整体模型。本发明用于因果事件抽取领域。

    一种用于复杂事件理解的动态假设验证方法及装置

    公开(公告)号:CN119088903A

    公开(公告)日:2024-12-06

    申请号:CN202411150973.3

    申请日:2024-08-21

    Abstract: 本发明公开了一种用于复杂事件理解的动态假设验证方法及装置,属于自然语言处理技术领域。方法包括以下步骤:S1、采集并标注数据集;S2、构建动态多视角思维代理框架,采用所述数据集对所述动态多视角思维代理框架进行训练,并基于训练后的所述动态多视角思维代理框架对用户关于复杂事件的查询生成综合答案。本发明通过提出一种新颖的动态多视角思维代理框架使语言模型能够主动提出并动态调整假设,通过检索和推理过程验证假设,并最终综合出全面的解决方案。

    一种基于因果事件抽取模型的因果事件抽取方法

    公开(公告)号:CN116431789A

    公开(公告)日:2023-07-14

    申请号:CN202310419495.0

    申请日:2023-04-19

    Abstract: 本发明公开了一种基于因果事件抽取模型的因果事件抽取方法,包括以下步骤:基于事件抽取以及因果关系识别两个子任务,构建因果事件抽取模型;获取待输入语句;基于预训练语言模型,对待输入语句进行编码,基于序列标注解码器,对编码的待输入语句进行解码,抽取存在因果关联的事件;基于因果事件抽取模型,构建初始背景图;将事件插入到初始背景图,获得更新背景图;采用图神经网络,对更新背景图,进行编码以及更新,获得抽取的事件的表示;基于分类器以及抽取的事件的表示,获得事件之间的因果关系,实现因果事件的抽取。对不同因果事件对的句子的实验结果证明了本发明的方法抽取复杂因果关系的能力。

    一种预训练语言模型的构建方法及系统

    公开(公告)号:CN115392218B

    公开(公告)日:2023-06-20

    申请号:CN202210837482.0

    申请日:2022-07-15

    Inventor: 丁效 陈薄文 杜理

    Abstract: 本申请公开了一种预训练语言模型的构建方法及系统,方法包括:获取认知语言数据;收录认知语言数据和眼动数据;根据认知语言数据诱导出细化的粒度的认知特征;将加权之后的各认知特征和眼动数据纳入BERT中进行训练,得到一种改进版本的预训练语言模型。本申请通过将人类的眼球运动轨迹捕捉数据与心理语言学关于人类语言学习的相关理论进行结合,并设计新的训练手段和方法,将这两者与预训练模型进行进一步融合,通过这一方法,能够使得预训练模型具有一定程度的人类认知特征,从而使得模型原本的模型更加优秀的任务表现。

    一种基于消费事理图谱的消费意图识别和预测方法

    公开(公告)号:CN112132633B

    公开(公告)日:2021-07-06

    申请号:CN202011069677.2

    申请日:2020-09-30

    Abstract: 一种基于消费事理图谱的消费意图识别和预测方法,它属于消费意图识别与预测技术领域。本发明解决了现有技术对消费意图识别和预测的准确率低的问题。本发明所采用的主要技术方案为:步骤一、基于预训练模型进行事件抽取;步骤二、基于预训练模型进行事件间关系抽取;步骤三、基于评论语料,采用无监督方法构建二分图作为弱监督信息;步骤四、基于二分图弱监督信息和标注数据,构建消费事理图谱;步骤五、使用训练数据训练同异质关系注意力模型,使用同异质关系注意力模型判断事件和消费意图的对应关系。本发明可以应用于消费意图识别与预测。

    一种文本预测结果的关键证据抽取方法

    公开(公告)号:CN110083836B

    公开(公告)日:2021-07-06

    申请号:CN201910335219.X

    申请日:2019-04-24

    Inventor: 丁效 刘挺 段俊文

    Abstract: 一种文本预测结果的关键证据抽取方法,本发明涉及文本预测结果的关键证据抽取方法。本发明的目的是为了解决现有技术在文本中抽取能解释预测结果的关键证据时依赖人工标注来寻找证据的问题。过程为:一、得到句子级向量;二、将句子级向量的平均值作为外部存储单元的初值;三、得到第一个句子级向量对应的更新后的外部存储单元;直至得到第n个句子级向量对应的最终的外部存储单元,即得到文档级向量;四、输出文档每个类别的概率;五、得到训练好的硬抽取网络模型;将待分类的文档输入到训练好的硬抽取网络模型,得到待分类的文档分为各个类别的概率以及文档被分为该类别的句子集合。本发明用于文本预测结果的证据抽取领域。

    一种基于消费事理图谱的消费意图识别和预测方法

    公开(公告)号:CN112132633A

    公开(公告)日:2020-12-25

    申请号:CN202011069677.2

    申请日:2020-09-30

    Abstract: 一种基于消费事理图谱的消费意图识别和预测方法,它属于消费意图识别与预测技术领域。本发明解决了现有技术对消费意图识别和预测的准确率低的问题。本发明所采用的主要技术方案为:步骤一、基于预训练模型进行事件抽取;步骤二、基于预训练模型进行事件间关系抽取;步骤三、基于评论语料,采用无监督方法构建二分图作为弱监督信息;步骤四、基于二分图弱监督信息和标注数据,构建消费事理图谱;步骤五、使用训练数据训练同异质关系注意力模型,使用同异质关系注意力模型判断事件和消费意图的对应关系。本发明可以应用于消费意图识别与预测。

Patent Agency Ranking