一种基于事理图谱和大模型的推演方法及系统

    公开(公告)号:CN119721257A

    公开(公告)日:2025-03-28

    申请号:CN202510206413.3

    申请日:2025-02-25

    Abstract: 本发明属于人工智能领域,提出一种基于事理图谱和大模型的推演方法及系统,通过构建包含现实事件和虚拟事件的事件库,并基于这些事件库建立事理图谱,能够扩展数据集的范围,使其不受实际数据的限制,这样不仅丰富了数据的多样性,还为推荐系统提供了创新的可能性,使得推荐结果更加丰富和多元;使用事理图谱构造用于大模型训练的指令数据集,能够更好地描述事件之间的复杂关系和动态过程,从而在构建指令数据集能够提供更加准确和深入的知识支持;通过指令调优即指令数据集中的指令约束大模型的输出,提高了对大模型的输出的可控性和可预测性;大模型具备了强大的推演能力,突破了事理图谱库的规模限制,推演结果可能具有一定的创新性。

    一种基于提示学习的海关税收风险知识抽取方法

    公开(公告)号:CN118296134A

    公开(公告)日:2024-07-05

    申请号:CN202410718893.7

    申请日:2024-06-05

    Abstract: 本发明涉及海关数据处理技术领域,提出了一种基于提示学习的海关税收风险知识抽取方法,建立海关风险知识抽取的数据源:输入通用预训练命名实体识别模型抽取企业实体名称,并利用依存句法优化实体命名结果,得到候选名称;将候选名称放入提示学习语言模型进行验证,输出概率最高的企业实体名称;再进行风险评价提取:基于预训练语言模型的提示学习来对报道正负面做文本分类预测;最后将提取出企业实体名称、风险评价信息进行特征融合,并录入海关报关单数据库。提高实体命名识别的准确性,并解决了对海关风险信息领域的样本信息少,抽取任务准确率低的问题。

    构建中文事件库及基于该元事件库对元事件分析预测的方法及系统

    公开(公告)号:CN116383331A

    公开(公告)日:2023-07-04

    申请号:CN202310001827.3

    申请日:2023-01-03

    Abstract: 本发明提出了一种构建中文事件库及基于该元事件库对元事件分析预测的方法及系统。构建中文事件库的方法具体步骤包括:S1:元事件抽取;S2:元事件共指;S3:元事件关联;S4:元事件聚合;S5:最终通过S1‑S4形成元事件抽取库、元事件共指库、元事件关联库、元事件专题库,共同构成中文事件库。基于该元事件库形成的一种元事件可视化分析预测的方法,具体步骤包括:S1:元事件库检索;S2:元事件专题分析;S3:元事件预测分析。本发明构建一种适合中文新闻及情报数据处理、分析、预测的中文事件库,不局限于数据统计,实现对事件的语义分析,并通过该中文事件库,可视化元事件脉络,使中文元事件识别更准确,并可预测元事件的下一步发展趋势。

    一种基于互联网公开数据的企业关联信息挖掘方法

    公开(公告)号:CN117909559B

    公开(公告)日:2024-08-20

    申请号:CN202410170696.6

    申请日:2024-02-06

    Abstract: 本发明属于数据挖掘领域,提出了一种基于互联网公开数据的企业关联信息挖掘方法,通过搜索引擎自动搜索目标企业相关信息,获取特征信息,采集目标企业互联网公开数据,使用NLP技术处理采集的互联网公开数据,挖掘企业间关联关系,并分别从面向标题和面向段落的企业实体识别规则进行分阶段的提取,其对面向标题的企业实体识别规则中添加了价值判断,实现了自动且准确的从互联网采集数据中发掘企业关联信息,最大程度的解决了现有企业关联信息获取方法中存在的个人主观因素影响较大、特定站点数据不够全面、验证环节困难等问题。

Patent Agency Ranking