基于搜索引擎和分类器的远程监督关系抽取方法及装置

    公开(公告)号:CN116992869A

    公开(公告)日:2023-11-03

    申请号:CN202310881921.2

    申请日:2023-07-18

    Abstract: 本发明涉及自然语言处理技术领域,特别是指一种基于搜索引擎和分类器的远程监督关系抽取方法及装置。对小样本数据进行标注,获得远程监督知识库;输入未标注文本,根据远程监督知识库对未标注文本进行标注,获得第一监督文本;将第一监督文本以及监督知识库进行降噪处理,获得第二监督文本;基于词性表达式库,对第二监督文本进行分析,获得第三监督文本;根据第三监督文本,通过预设的训练模型进行相似语句生成,获得第四监督文本;根据第四监督文本进行关系抽取,获得远程监督文本关系。本发明是一种效率高、鲁邦性好的远程监督关系抽取方法。

Patent Agency Ranking