一种基于文本上下文结构和属性信息叠加网络的报刊新闻分类方法

    公开(公告)号:CN111966828A

    公开(公告)日:2020-11-20

    申请号:CN202010729459.0

    申请日:2020-07-27

    Abstract: 该发明公开了一种基于文本上下文结构和属性信息叠加网络的报刊新闻分类方法,属于信息处理领域。本发明使用文本向量表征方法将不定长度的文本转化为固定长度的向量避免了文本信息的丢失和冗余;从训练数据的角度来说,采用加权随机采样,通过权重调节样本被选择的可能性,优化训练样本的构成;从特征提取的角度来说,本文不仅考虑到上下文结果信息同时也兼顾文本属性信息,优化特征提取过程。本发明不仅改进了文本特征的提取方式,还额外地将属性特征纳入特征构建的过程中。使用文本向量表征方法将不定长度的文本转化为固定长度的向量避免了文本信息的丢失和冗余,优化了文本特征的提取方式;额外添加了新闻的特征信息,丰富了特征的来源。

    一种基于上下句关系预测的短文本事件共指消解方法

    公开(公告)号:CN116757218A

    公开(公告)日:2023-09-15

    申请号:CN202310563155.5

    申请日:2023-05-18

    Abstract: 该发明公开了一种基于上下句关系预测的短文本事件共指消解方法,属于自然语言处理技术领域。本发明从问题建模角度,利用Bert包含NSP任务的特点,将事件共指消解建模成上下句关系预测任务,能构成上下句的事件对认为即存在共指关系,这也符合人类的语言习惯,在日常对话中连贯的上下句往往都是在描述同一事实;从特征提取角度来说,通过事件抽取识别出文本中如触发词、论元角色、事件类型、时态等关键信息作为分类的辅助特征,可以在一定程度上提高分类的准确度;从算法性能角度分析,相比于传统神经网络Bert预训练模型具有更小的训练代价,可以更快地收敛并达到更好的性能。

    一种基于文本上下文结构和属性信息叠加网络的报刊新闻分类方法

    公开(公告)号:CN111966828B

    公开(公告)日:2022-05-03

    申请号:CN202010729459.0

    申请日:2020-07-27

    Abstract: 该发明公开了一种基于文本上下文结构和属性信息叠加网络的报刊新闻分类方法,属于信息处理领域。本发明使用文本向量表征方法将不定长度的文本转化为固定长度的向量避免了文本信息的丢失和冗余;从训练数据的角度来说,采用加权随机采样,通过权重调节样本被选择的可能性,优化训练样本的构成;从特征提取的角度来说,本文不仅考虑到上下文结果信息同时也兼顾文本属性信息,优化特征提取过程。本发明不仅改进了文本特征的提取方式,还额外地将属性特征纳入特征构建的过程中。使用文本向量表征方法将不定长度的文本转化为固定长度的向量避免了文本信息的丢失和冗余,优化了文本特征的提取方式;额外添加了新闻的特征信息,丰富了特征的来源。

Patent Agency Ranking