-
公开(公告)号:CN117370505A
公开(公告)日:2024-01-09
申请号:CN202310847321.4
申请日:2023-07-10
Applicant: 辽宁大学
IPC: G06F16/332 , G06F16/35 , G06F40/186 , G06F40/30
Abstract: 基于机器阅读理解和因子图注意力机制的事件检测方法,其步骤为:步骤1首先在模型的输入序列中引入预先设计好的触发词问题模板等和触发词相关的先验信息;步骤2利用预训练语言模型BERT对输入序列进行向量表示;步骤3利用因子图注意力网络对输入序列中的不同组成单元进行语义交互;步骤4将触发词识别及分类转化为传统的序列标注任务,利用多类型分类器识别并分类待检测文本中的单词。本发明通过上述结构,提供了一种利用相应的先验知识辅助事件检测,同时增加图注意力机制来优化触发词识别能力的方法,提升了事件检测的准确性。
-
公开(公告)号:CN115098676A
公开(公告)日:2022-09-23
申请号:CN202210722078.9
申请日:2022-06-24
Applicant: 辽宁大学
Abstract: 一种基于图卷积网络融合注意力机制的文本分类方法,包括以下步骤:步骤1采集样本文本数据,对采集到的样本文本数据进行预处理;步骤2将预处理之后的文本数据进行向量化表示;步骤3构建包含单词节点和文档节点的文本图;步骤4根据特征的重要程度,通过注意力机制对向量化的文本以及文本图的特征赋予权值;步骤5将进行多头自注意力计算之后的文本输入图卷积网络模型,获取各个文本与标签类别之间的关系;步骤6根据所述文本与标签类别之间的关系,获得文本的预测分类结果。本发明通过上述步骤,提供了一种高效、准确、分类效果好的文本分类方法。
-
公开(公告)号:CN114281998A
公开(公告)日:2022-04-05
申请号:CN202111624377.0
申请日:2021-12-28
Applicant: 辽宁大学
IPC: G06F16/35 , G06F16/38 , G06F40/295
Abstract: 本发明涉及基于众包技术的面向多层次标注者的事件标注系统的构建方法,包括以下步骤:1、收集领域数据并构建完整的实体库和事件信息库;2、预处理语料库并构建完整的待标注语料库存取机制:过滤掉无效文本,进行分句处理;3、构建完整的标注机制,先进行实体标注再进行事件标注;4、构建完整的众包任务分配机制和众包结果聚合机制;5、构建完整的数据集导出机制,根据下游事件抽取模型所需要的数据集格式动态地调控和构建所需事件抽取数据集。本发明能够有效地将多种众包技术应用于不同专业程度的标注者的标注过程中,从而有效利用标注者的背景知识,最大化地发挥众包的作用。
-
公开(公告)号:CN114281998B
公开(公告)日:2024-09-24
申请号:CN202111624377.0
申请日:2021-12-28
Applicant: 辽宁大学
IPC: G06F16/35 , G06F16/38 , G06F40/295
Abstract: 本发明涉及基于众包技术的面向多层次标注者的事件标注系统的构建方法,包括以下步骤:1、收集领域数据并构建完整的实体库和事件信息库;2、预处理语料库并构建完整的待标注语料库存取机制:过滤掉无效文本,进行分句处理;3、构建完整的标注机制,先进行实体标注再进行事件标注;4、构建完整的众包任务分配机制和众包结果聚合机制;5、构建完整的数据集导出机制,根据下游事件抽取模型所需要的数据集格式动态地调控和构建所需事件抽取数据集。本发明能够有效地将多种众包技术应用于不同专业程度的标注者的标注过程中,从而有效利用标注者的背景知识,最大化地发挥众包的作用。
-
-
-