综合词位置因素和词频因素的文本关键词权重计算方法

    公开(公告)号:CN109766408A

    公开(公告)日:2019-05-17

    申请号:CN201811471124.2

    申请日:2018-12-04

    Applicant: 上海大学

    Abstract: 本发明涉及一种综合词位置因素和词频因素的文本关键词权重计算方法,该方法具体步骤如下:(1)打开单篇文本,将其段落进行重新组合形成新文本;(2)对新文本进行预处理,包括分词和去除停用词,余下词作为候选关键词构建候选关键词矩阵;(3)利用调和级数综合词位置因素和词频因素计算每个候选关键词的权重;(4)输出每个候选关键词对应的权重。该方法充分利用文本结构信息,即融合文本中词位置因素和词频因素,能够在不依赖领域文本集的前提下只针对单篇文本对关键词的权重进行计算;该方法比TFIDF和TEXTRANK简便易操作,效果好,并且能够兼具TFIDF和TEXTRANK的功能。

    一种融合文本语法结构和语义信息的文本实体关系自动分类方法

    公开(公告)号:CN111177383B

    公开(公告)日:2024-01-16

    申请号:CN201911345630.1

    申请日:2019-12-24

    Abstract: 本发明公开了一种融合文本语法结构和语义信息的文本实体关系自动分类方法。该方法的具体实施步骤如下:(1)、对文本集预处理得到句子初始向量;(2)、提取句中词语与实体及关系的相关度,更新句子向量;(3)、将(2)的句子向量输入双向门循环单元神经网络,得到融合语义信息的句子向量;(4)、将(2)的句子向量输入图注意力神经网络,得到融合语法结构信息的句子向量;(5)、将(3)的输出和(4)的输出进行拼接,更新句子向量;(6)、将(5)的句子向量输入全连接神经网络层,得到句子的特征向量,经softmax变换输出实体关系分类向量。本方法能够有效缓解实体关系分类中语义特征、语法特征难以表示及

    一种融合文本语法结构和语义信息的文本实体关系自动分类方法

    公开(公告)号:CN111177383A

    公开(公告)日:2020-05-19

    申请号:CN201911345630.1

    申请日:2019-12-24

    Abstract: 本发明公开了一种融合文本语法结构和语义信息的文本实体关系自动分类方法。该方法的具体实施步骤如下:(1)、对文本集预处理得到句子初始向量;(2)、提取句中词语与实体及关系的相关度,更新句子向量;(3)、将(2)的句子向量输入双向门循环单元神经网络,得到融合语义信息的句子向量;(4)、将(2)的句子向量输入图注意力神经网络,得到融合语法结构信息的句子向量;(5)、将(3)的输出和(4)的输出进行拼接,更新句子向量;(6)、将(5)的句子向量输入全连接神经网络层,得到句子的特征向量,经softmax变换输出实体关系分类向量。本方法能够有效缓解实体关系分类中语义特征、语法特征难以表示及人工特征选择误差大的问题。

Patent Agency Ranking