-
公开(公告)号:CN111310470B
公开(公告)日:2021-11-19
申请号:CN202010053878.7
申请日:2020-01-17
Applicant: 西安交通大学
IPC: G06F40/295
Abstract: 本发明公开了一种融合字词特征的中文命名实体识别方法,通过拼接字向量xc、位置向量xs和词的映射向量xw构建特征表示层,作为模型的输入向量xemb;将输入向量xemb输入BiLSTM,得到当前时刻的上下文特征向量对该特征向量执行非线性转换,输出待解码的得分信息P;将得分信息P输入CRF层,同时引入转移得分矩阵A,CRF根据序列的全局标签概率p(y|x)选择全局最优的标签序列,输出序列标注结果y1,y2,...,yn,完成中文命名实体识别。本发明通过综合分析后得到的结果数据加强了模型对文本的理解,提高了模型识别任务中的F1值。
-
公开(公告)号:CN111310470A
公开(公告)日:2020-06-19
申请号:CN202010053878.7
申请日:2020-01-17
Applicant: 西安交通大学
IPC: G06F40/295
Abstract: 本发明公开了一种融合字词特征的中文命名实体识别方法,通过拼接字向量xc、位置向量xs和词的映射向量xw构建特征表示层,作为模型的输入向量xemb;将输入向量xemb输入BiLSTM,得到当前时刻的上下文特征向量 对该特征向量执行非线性转换,输出待解码的得分信息P;将得分信息P输入CRF层,同时引入转移得分矩阵A,CRF根据序列的全局标签概率p(y|x)选择全局最优的标签序列,输出序列标注结果y1,y2,...,yn,完成中文命名实体识别。本发明通过综合分析后得到的结果数据加强了模型对文本的理解,提高了模型识别任务中的F1值。
-