一种应用于裁判文书中敏感信息的识别方法

    公开(公告)号:CN110826316B

    公开(公告)日:2021-08-10

    申请号:CN201911077763.5

    申请日:2019-11-06

    Abstract: 本发明实施例提供了一种应用于裁判文书中敏感信息的识别方法,包括:步骤1:在中国裁判文书网上获取的裁判文书,对裁判文书进行分句和分词处理;步骤2:对处理后的裁判文书进行命名实体识别抽取实体以及属性值;步骤3:对处理后的裁判文书进行语义角色标注,构建关于事件发生情况的三元组;步骤4:对抽取实体和属性值利用关系抽取,构建关系三元组;步骤5:根据事件发生情况的三元组和关系三元组通过实体对齐构建结构数据网;步骤6:根据不宜公开的信息内容定义敏感信息,利用结构数据网标注裁判文书中所对应的敏感信息。本发明实施例提供了一种应用于裁判文书中敏感信息的识别方法,利用机器学习对法律概念、自然语言的语义理解,对裁判文书中的敏感信息进行识别,对司法公开,保障公众的知情权和监督权具有良好的现实意义。

    一种应用于裁判文书中敏感信息的识别方法

    公开(公告)号:CN110826316A

    公开(公告)日:2020-02-21

    申请号:CN201911077763.5

    申请日:2019-11-06

    Abstract: 本发明实施例提供了一种应用于裁判文书中敏感信息的识别方法,包括:步骤1:在中国裁判文书网上获取的裁判文书,对裁判文书进行分句和分词处理;步骤2:对处理后的裁判文书进行命名实体识别抽取实体以及属性值;步骤3:对处理后的裁判文书进行语义角色标注,构建关于事件发生情况的三元组;步骤4:对抽取实体和属性值利用关系抽取,构建关系三元组;步骤5:根据事件发生情况的三元组和关系三元组通过实体对齐构建结构数据网;步骤6:根据不宜公开的信息内容定义敏感信息,利用结构数据网标注裁判文书中所对应的敏感信息。本发明实施例提供了一种应用于裁判文书中敏感信息的识别方法,利用机器学习对法律概念、自然语言的语义理解,对裁判文书中的敏感信息进行识别,对司法公开,保障公众的知情权和监督权具有良好的现实意义。

Patent Agency Ranking