一种基于大数据的法律判决文书知识图谱智能构建方法

    公开(公告)号:CN118410172A

    公开(公告)日:2024-07-30

    申请号:CN202310420799.9

    申请日:2023-04-19

    Abstract: 本发明属于自然语言处理的命名实体识别和关系抽取领域,具体涉及一种基于大数据的法律判决文书知识图谱智能构建方法,包括:使用法律判决文书数据构造司法领域知识词典;根据文本数据和关系类型特征进行实体关系抽取,得到判决文书中的实体以及实体间的关系;将抽取的实体关系进行交叉注意力计算,得到实体与关系之间的注意力矩阵;从注意力矩阵中解码出实体关系三元组,得到法律判决文书知识图谱。本发明通过进行实体关系抽取时引入了通用词语信息和司法词典知识,解决了法律判决文书信息抽取困难的问题,实现了司法知识图谱的有效构建。

    一种基于大数据的司法领域类案推送方法

    公开(公告)号:CN116610770A

    公开(公告)日:2023-08-18

    申请号:CN202310464853.X

    申请日:2023-04-26

    Abstract: 本发明涉及自然语言处理技术领域,具体涉及一种基于大数据的司法领域类案推送方法;包括将司法领域文书上传到数据库进行匹配;将司法领域文书及其匹配数据输入到训练好的类案相似度计算模型,输出该司法领域文书与每一个匹配数据的相似度;将所有相似度按照大小降序排列,并选取前k个相似度所对应的匹配数据进行推送;本发明解决了文书文本在预训练模型表征中文本特征趋同的难题,并通过数据扰动的方法进行数据增强,克服了司法领域文书类案推送情景下构建有监督样本时间、人工成本高的困难,可以高效、低成本和自动化地完成精准司法领域类案推送,帮助司法领域从业人员快速地获取与他们正在处理的案件相关的信息和先前的裁决结果。

Patent Agency Ranking