基于知识图谱的敏感文本检测方法及系统

    公开(公告)号:CN113963357B

    公开(公告)日:2022-03-11

    申请号:CN202111535596.1

    申请日:2021-12-16

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于知识图谱的敏感文本检测方法及系统,其中方法包括:爬取网络中现有知识,对所述现有知识进行预处理,得到知识图谱网络;获取网络中的敏感文本,对所述敏感文本进行预处理,得到训练语料;根据所述训练语料和所述知识图谱网络得到文本检测模型的编码信息,将所述编码信息转化为向量表示,得到最终的所述文本检测模型;对待测试文本进行预处理,根据所述文本检测模型得到检测结果。本发明通过知识图谱引入外部知识,建立文本检测模型,并通过多视图推理网络对外部知识进行进一步融合,使得外部知识能够得到充分利用。

    基于知识图谱的敏感文本检测方法及系统

    公开(公告)号:CN113963357A

    公开(公告)日:2022-01-21

    申请号:CN202111535596.1

    申请日:2021-12-16

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于知识图谱的敏感文本检测方法及系统,其中方法包括:爬取网络中现有知识,对所述现有知识进行预处理,得到知识图谱网络;获取网络中的敏感文本,对所述敏感文本进行预处理,得到训练语料;根据所述训练语料和所述知识图谱网络得到文本检测模型的编码信息,将所述编码信息转化为向量表示,得到最终的所述文本检测模型;对待测试文本进行预处理,根据所述文本检测模型得到检测结果。本发明通过知识图谱引入外部知识,建立文本检测模型,并通过多视图推理网络对外部知识进行进一步融合,使得外部知识能够得到充分利用。

Patent Agency Ranking