基于图网络融入词典的中文命名实体识别方法

    公开(公告)号:CN111046671A

    公开(公告)日:2020-04-21

    申请号:CN201911275401.7

    申请日:2019-12-12

    Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于图网络融入词典的中文命名实体识别方法、系统、装置,旨在解决基于字的模型的中文命名实体识别方法没有利用词的信息,导致命名实体的识别精度较低的问题。本系统方法包括获取待识别语句的字向量表示,基于字向量表示,通过双向长短期记忆网络得到待识别语句的句子表示;基于待识别语句,获取其与预设的词典匹配的词的向量表示;将句子表示、词的向量表示进行拼接,通过图网络获取融合多种词典知识的句子表示;基于融合多种词典知识的句子表示,采用条件随机场算法和维特比解码算法获取命名实体的识别结果。本发明提高了中文命名实体的识别精度。

    基于联邦学习的分布式语言关系识别方法、系统和装置

    公开(公告)号:CN112101578B

    公开(公告)日:2021-02-23

    申请号:CN202011285430.4

    申请日:2020-11-17

    Abstract: 本发明属于数据识别领域,具体涉及了一种基于联邦学习的分布式语言关系识别方法、系统和装置,旨在解决多个参与方在不共享数据的基础上难以联合建模的问题。本发明包括:各个本地平台获取待识别数据和带标签的本地训练数据,在根据本地训练数据训练本地分类器模型,用训练好的分类器模型集成为全局分类器模型,再通过全局分类器模型初始化本地分类器模型,用初始化后的本地分类模型识别待识别的数据获得语言关系预测结果。本发明实现了在不共享数据的基础上将本地平台结合其它平台进行数据使用和机器学习建模,提高了自然语言识别模型训练的协作性,解决了数据孤岛的问题,降低各个平台训练模型所需的训练数据总量和要求。

    基于联邦学习的分布式语言关系识别方法、系统和装置

    公开(公告)号:CN112101578A

    公开(公告)日:2020-12-18

    申请号:CN202011285430.4

    申请日:2020-11-17

    Abstract: 本发明属于数据识别领域,具体涉及了一种基于联邦学习的分布式语言关系识别方法、系统和装置,旨在解决多个参与方在不共享数据的基础上难以联合建模的问题。本发明包括:各个本地平台获取待识别数据和带标签的本地训练数据,在根据本地训练数据训练本地分类器模型,用训练好的分类器模型集成为全局分类器模型,再通过全局分类器模型初始化本地分类器模型,用初始化后的本地分类模型识别待识别的数据获得语言关系预测结果。本发明实现了在不共享数据的基础上将本地平台结合其它平台进行数据使用和机器学习建模,提高了自然语言识别模型训练的协作性,解决了数据孤岛的问题,降低各个平台训练模型所需的训练数据总量和要求。

Patent Agency Ranking