-
公开(公告)号:CN118333056A
公开(公告)日:2024-07-12
申请号:CN202410434428.0
申请日:2024-04-11
Applicant: 西北农林科技大学
IPC: G06F40/295 , G06N3/0442 , G06F18/213 , G06F18/25 , G06N3/0495 , G06N3/082 , G06N3/047
Abstract: 本发明提供了一种考虑双维信息的中文猕猴桃文本命名实体识别方法,双维信息为水平维度文本信息与垂直维度文本信息,包括:步骤1,构建中文猕猴桃文本数据集;步骤2,中文猕猴桃文本矢量化;步骤3,通过CoordKIWINER模块增强字符矢量文本信息;步骤4,使用PruneBi‑LSTM网络对中文猕猴桃文本进行序列编码;步骤5,使用条件随机场,对语句特征矢量H进行译码,得到输入的特征张量X最终的输出序列Y*。本发明创造性地设计了CoordKIWINER与PruneBi‑LSTM两个模块,有效解决了中文猕猴桃文本双维度信息未被利用这一问题,进一步提升了针对猕猴桃文本命名实体识别的准确率,并在自建领域数据集上取得了最优的效果。