一种基于结构化语义知识增强的数据识别方法

    公开(公告)号:CN119597915A

    公开(公告)日:2025-03-11

    申请号:CN202411638173.6

    申请日:2024-11-16

    Applicant: 南开大学

    Abstract: 本发明属于自然语言处理领域,特别是涉及一种基于结构化语义知识增强的数据识别方法。该方法包括:1)将经过处理和清洗后的数据集文本输入到文本编码器中,获得文本特征向量。2)对于经过处理和清洗后的数据集文本,使用基于Transformer的自动抽象语义表示解析器来获得相应的抽象语义表示图。在获得抽象语义表示图之后,通过确定性拓扑增强和概率性拓扑增强策略生成内聚子图,3)采用图编码器从抽象语义表示图和它们的内聚子图中提取相应的图特征向量。4)采用对比学习区分具有不同相似度的图文对。5)得到训练模型后,通过抽取事件测试效果。

Patent Agency Ranking