-
公开(公告)号:CN115114923A
公开(公告)日:2022-09-27
申请号:CN202210656656.3
申请日:2022-06-10
Applicant: 中国科学院软件研究所
IPC: G06F40/295 , G06F40/216 , G06F40/242 , G06F40/30 , G06N3/04
Abstract: 本发明属于自然语言处理领域,特别是命名实体识别领域,具体涉及一种小型的融合中文词嵌入的命名实体识别方法和系统。现有的融合中文词嵌入的命名实体识别方法,存在模型的参数较多,运算时间过长的问题,并不能很好的应用到小型的移动设备上。本发明主要包括四个模块:字符表示、单词表示、句子表示和句子解码,首先句子中的字符通过字符嵌入得到字符表示,之后通过将句子和中文词嵌入进行匹配和BME的单词映射,得到单词表示,然后我们将字符表示和单词表示连接,输入到GRU当中,得到句子表示,最后对句子表示进行句子解码,得到最终的结果。通过对于单词表示和句子表示的改进,最终实现缩小模型参数和加快识别速度的要求。