基于众包技术的面向多层次标注者的事件标注系统构建方法

    公开(公告)号:CN114281998A

    公开(公告)日:2022-04-05

    申请号:CN202111624377.0

    申请日:2021-12-28

    Applicant: 辽宁大学

    Abstract: 本发明涉及基于众包技术的面向多层次标注者的事件标注系统的构建方法,包括以下步骤:1、收集领域数据并构建完整的实体库和事件信息库;2、预处理语料库并构建完整的待标注语料库存取机制:过滤掉无效文本,进行分句处理;3、构建完整的标注机制,先进行实体标注再进行事件标注;4、构建完整的众包任务分配机制和众包结果聚合机制;5、构建完整的数据集导出机制,根据下游事件抽取模型所需要的数据集格式动态地调控和构建所需事件抽取数据集。本发明能够有效地将多种众包技术应用于不同专业程度的标注者的标注过程中,从而有效利用标注者的背景知识,最大化地发挥众包的作用。

    基于众包技术的面向多层次标注者的事件标注系统构建方法

    公开(公告)号:CN114281998B

    公开(公告)日:2024-09-24

    申请号:CN202111624377.0

    申请日:2021-12-28

    Applicant: 辽宁大学

    Abstract: 本发明涉及基于众包技术的面向多层次标注者的事件标注系统的构建方法,包括以下步骤:1、收集领域数据并构建完整的实体库和事件信息库;2、预处理语料库并构建完整的待标注语料库存取机制:过滤掉无效文本,进行分句处理;3、构建完整的标注机制,先进行实体标注再进行事件标注;4、构建完整的众包任务分配机制和众包结果聚合机制;5、构建完整的数据集导出机制,根据下游事件抽取模型所需要的数据集格式动态地调控和构建所需事件抽取数据集。本发明能够有效地将多种众包技术应用于不同专业程度的标注者的标注过程中,从而有效利用标注者的背景知识,最大化地发挥众包的作用。

Patent Agency Ranking