一种基于细粒度词表示模型的序列标注模型

    公开(公告)号:CN108460013A

    公开(公告)日:2018-08-28

    申请号:CN201810120922.4

    申请日:2018-01-30

    Abstract: 本发明提供了一种基于细粒度词表示模型的序列标注模型,用于进行序列标注任务,属于计算机应用及自然语言处理领域。本发明的模型结构主要由特征表示层、BiLSTM和CRF层3部分构成。利用该模型进行序列标注任务时,首先提出一种基于注意力机制的字符级词表示模型Finger来融合形态学信息和单词的字符信息,然后由Finger与BiLSTM-CRF模型共同完成序列标注任务,最终该方法以端到端、无任何特征工程形式在CoNLL 2003数据集上取得了F1为91.09%的结果。实验表明本发明设计的Finger模型显著提升序列标注系统的召回率,从而使得模型的识别能力显著提升。

    一种社交媒体事件级新闻中新闻媒体影响力评估方法

    公开(公告)号:CN108959364B

    公开(公告)日:2022-02-22

    申请号:CN201810486091.2

    申请日:2018-05-21

    Abstract: 一种社交媒体事件级新闻中新闻媒体影响力评估方法,属于数据挖掘和复杂网络技术领域,用于解决评估新闻媒体影响力的问题,技术要点是包括R1、采集社交媒体数据,构建事件语料库;R2、统计语料库中各用户的相关数据;R3、构建转发网络;R4、构建评价模型评估新闻媒体影响力;R5、以国家为单位,对影响力进行可视化;本发明可以从事件层面出发,评估新闻媒体影响力,并以国家为单位对影响力进行展示。

    一种基于细粒度词表示模型的序列标注模型及方法

    公开(公告)号:CN108460013B

    公开(公告)日:2021-08-20

    申请号:CN201810120922.4

    申请日:2018-01-30

    Abstract: 本发明提供了一种基于细粒度词表示模型的序列标注模型,用于进行序列标注任务,属于计算机应用及自然语言处理领域。本发明的模型结构主要由特征表示层、BiLSTM和CRF层3部分构成。利用该模型进行序列标注任务时,首先提出一种基于注意力机制的字符级词表示模型Finger来融合形态学信息和单词的字符信息,然后由Finger与BiLSTM‑CRF模型共同完成序列标注任务,最终该方法以端到端、无任何特征工程形式在CoNLL 2003数据集上取得了F1为91.09%的结果。实验表明本发明设计的Finger模型显著提升序列标注系统的召回率,从而使得模型的识别能力显著提升。

    一种社交媒体事件级新闻中新闻媒体影响力评估方法

    公开(公告)号:CN108959364A

    公开(公告)日:2018-12-07

    申请号:CN201810486091.2

    申请日:2018-05-21

    CPC classification number: G06Q50/01

    Abstract: 一种社交媒体事件级新闻中新闻媒体影响力评估方法,属于数据挖掘和复杂网络技术领域,用于解决评估新闻媒体影响力的问题,技术要点是包括R1、采集社交媒体数据,构建事件语料库;R2、统计语料库中各用户的相关数据;R3、构建转发网络;R4、构建评价模型评估新闻媒体影响力;R5、以国家为单位,对影响力进行可视化;本发明可以从事件层面出发,评估新闻媒体影响力,并以国家为单位对影响力进行展示。

    一种基于词向量的缩写词歧义消除系统及方法

    公开(公告)号:CN104731771A

    公开(公告)日:2015-06-24

    申请号:CN201510140879.4

    申请日:2015-03-27

    Inventor: 张绍武 马建伟

    Abstract: 本发明涉及一种基于词向量的缩写词歧义消除系统及方法,首先将对含有目标缩写词的待检测文档中所有非字母符号及停用词全部去除;其次选择出现在目标缩写词前后距离小于固定长度以内的词语作为备选关键词,并对备选关键词通过相对重要性进行筛选得到上下文关键词,并将得到所有目标缩写词的上下文关键词集合;然后在该词向量集合中的词向量和上下文关键词所对应的词向量进行加和,得到待检测文档中每个目标缩写词的词向量表示;最后将目标缩写词的词向量表示与缩写词库中的目标缩写词的每个意义的词向量表示做比对,选择最相似的意义作为待检测文档中目标缩写词的意义。因此,本发明可以广泛用于各个缩略语消岐领域。

Patent Agency Ranking