一种使用自述式提示与集成梯度的语义贡献识别方法及系统

    公开(公告)号:CN119990134A

    公开(公告)日:2025-05-13

    申请号:CN202411808989.9

    申请日:2024-12-10

    Abstract: 本发明提供一种使用自述式提示与集成梯度的语义贡献识别方法及系统,包括:获取输入数据并编写特定的问题提示;将所述问题提示多次输入至预设的大语言模型,引导大语言模型自动识别并报告在决策过程中起到关键作用的词汇,生成关键词提议集合;基于所述关键词提议集合抽取关键词,生成第一语义贡献度列表;基于所述输入数据通过预设的公式进行集成梯度计算,生成第二语义贡献度列表;将所述第一语义贡献度列表和第二语义贡献度列表进行整合分析,确定对大语言模型决策有重大影响的词汇。本发明解决了现有技术中大语言模型行为解释单一方法的局限性问题,提高了模型解释的全面性和准确性,满足了在多种自然语言处理应用中对可解释性的要求。

    事件关系预测方法、装置、电子设备、介质及程序产品

    公开(公告)号:CN116501868A

    公开(公告)日:2023-07-28

    申请号:CN202310325479.5

    申请日:2023-03-29

    Applicant: 清华大学

    Abstract: 本发明实施例提供一种事件关系预测方法、装置、电子设备、介质及程序产品,该方法包括:对输入文本进行聚类得到多个互不相交的原始组;对原始组进行两两融合得到多个交叉组;利用摘要生成模型生成原始组的第一摘要及交叉组的第二摘要;分别获取输入文本、第一摘要及第二摘要中的事件的向量表示及事件对的向量表示;根据输入文本、第一摘要及第二摘要中事件对的向量表示获取待预测事件对的向量表示;将待预测事件对的向量表示输入至预训练的事件关系预测模型,输出待预测事件对的事件关系预测结果。本发明实施例有效提升了模型处理长距离事件关系预测的能力,减少事件关系预测过程中遇到的冗余信息的影响,提高了事件关系的预测效率和准确率。

    基于文本的事件检测方法、装置、计算机设备及存储介质

    公开(公告)号:CN110188172A

    公开(公告)日:2019-08-30

    申请号:CN201910471605.1

    申请日:2019-05-31

    Abstract: 本申请是关于一种基于文本的事件检测方法。该方法包括:获取分别包含事件实例的第一数据集和第二数据集,第一数据集中包含默认可信的事件实例,第二数据集中包含默认不可信的事件实例;通过第一数据集和第二数据集训练对抗网络,通过训练完成的对抗网络,获取第二数据集中的可信的事件实例。本方案通过包含默认可信的事件实例的第一数据集,以及包含默认不可信的事件实例的第二数据集,训练对抗网络中的生成器和判别器,使得训练后的判别器能够准确的判别出第二数据集中的事件实例是否可信,节省了数据准备时间,提高了基于文本的事件检测效率,并且能够准确的排除第二数据集中的噪声数据,提高事件检测的准确性。

    一种事件抽取方法、相关装置、设备及存储介质

    公开(公告)号:CN113761122B

    公开(公告)日:2025-03-07

    申请号:CN202110546916.7

    申请日:2021-05-19

    Abstract: 本申请实施例公开了一种事件抽取方法、相关装置、设备及存储介质,用于将句级自然语言转化为结点和边,再将结点和边转化为语义特征来进行事件抽取,能够保证获取事件的精度。本申请实施例方法包括:获取待处理文本;根据待处理文本生成抽象语义表示,抽象语义表示包括与词语一一对应的结点,以及用于连接结点之间边;对抽象语义和文本表示进行语义编码处理,得到语义嵌入向量,语义嵌入向量用于表示每个词语的与事件之间的语义特征;对抽象语义表示进行图编码处理,得到图嵌入向量,其中,图嵌入向量为用于表示通过边相连接的结点的结构特征;将语义嵌入向量与图嵌入向量进行拼接,得到拼接特征向量;对拼接特征向量进行识别,输出目标事件。

    文本中事件角色的处理方法、装置、设备及存储介质

    公开(公告)号:CN110781302A

    公开(公告)日:2020-02-11

    申请号:CN201911013208.6

    申请日:2019-10-23

    Abstract: 本发明提供了一种文本中事件角色的处理方法、装置、电子设备及存储介质;方法包括:通过角色处理模型中的编码器对文本中的单词进行编码,得到文本中单词的编码信息;通过编码器对文本中单词的编码信息进行特征聚合,得到所述文本的聚合特征;通过所述角色处理模型中的注意力模型,将至少一个事件角色的多个上层概念、以及所述文本中单词的编码信息进行关联,得到所述文本面向所述事件角色的语义向量;通过所述角色处理模型中的分类器对至少一个所述文本面向所述事件角色的语义向量、以及所述文本的聚合特征进行分类,得到对应所述文本的事件角色。通过本发明,能够根据事件角色的上层概念,自动并准确地抽取文本中的事件角色。

    一种事件抽取方法、相关装置、设备及存储介质

    公开(公告)号:CN113761122A

    公开(公告)日:2021-12-07

    申请号:CN202110546916.7

    申请日:2021-05-19

    Abstract: 本申请实施例公开了一种事件抽取方法、相关装置、设备及存储介质,用于将句级自然语言转化为结点和边,再将结点和边转化为语义特征来进行事件抽取,能够保证获取事件的精度。本申请实施例方法包括:获取待处理文本;根据待处理文本生成抽象语义表示,抽象语义表示包括与词语一一对应的结点,以及用于连接结点之间边;对抽象语义和文本表示进行语义编码处理,得到语义嵌入向量,语义嵌入向量用于表示每个词语的与事件之间的语义特征;对抽象语义表示进行图编码处理,得到图嵌入向量,其中,图嵌入向量为用于表示通过边相连接的结点的结构特征;将语义嵌入向量与图嵌入向量进行拼接,得到拼接特征向量;对拼接特征向量进行识别,输出目标事件。

    基于事件的文档检索方法、装置、电子设备及存储介质

    公开(公告)号:CN118568195A

    公开(公告)日:2024-08-30

    申请号:CN202410450531.4

    申请日:2024-04-15

    Applicant: 清华大学

    Abstract: 本发明提供一种基于事件的文档检索方法、装置、电子设备及存储介质,其中的方法包括:获取用户对于待检索文档集的用户查询语句;将用户查询语句输入至预先训练的大语言模型,得到文档检索结果;其中,大语言模型通过根据文档表示和文档标识符构成的训练样本数据集进行训练优化得到,文档表示通过待检索文档集中的事件及事件关系表示得到,文档标识符通过将待检索文档集中的事件映射到事件层次结构中得到。该方法通过将文档内容之间的关联性纳入考虑范畴,利用事件及事件关系有效表示待检索文档,显著提升了大语言模型的文档检索性能;通过采用事件层次结构来构建具备明确语义结构的文档标识符,有效加强了文档标识符与文档内容之间的联系。

    基于文本的事件检测方法、装置、计算机设备及存储介质

    公开(公告)号:CN110188172B

    公开(公告)日:2022-10-28

    申请号:CN201910471605.1

    申请日:2019-05-31

    Abstract: 本申请是关于一种基于文本的事件检测方法。该方法包括:获取分别包含事件实例的第一数据集和第二数据集,第一数据集中包含默认可信的事件实例,第二数据集中包含默认不可信的事件实例;通过第一数据集和第二数据集训练对抗网络,通过训练完成的对抗网络,获取第二数据集中的可信的事件实例。本方案通过包含默认可信的事件实例的第一数据集,以及包含默认不可信的事件实例的第二数据集,训练对抗网络中的生成器和判别器,使得训练后的判别器能够准确的判别出第二数据集中的事件实例是否可信,节省了数据准备时间,提高了基于文本的事件检测效率,并且能够准确的排除第二数据集中的噪声数据,提高事件检测的准确性。

Patent Agency Ranking