一种面向图片文本的命名实体识别方法、电子设备、介质

    公开(公告)号:CN116563856A

    公开(公告)日:2023-08-08

    申请号:CN202310675395.4

    申请日:2023-06-08

    Applicant: 浙江大学

    Abstract: 本发明公开了一种面向图片文本的命名实体识别方法、电子设备、介质,包括:获取包含有文本的图片,对其进行文字检测,分割文本行图片;对文本行图片进行文字识别,得到中文文字信息;对文本行图片进行图片分割,得到若干个图片块;对图片块进行向量平展,得到一维的特征向量序列;在每一图片块对应的特征向量叠加第一位置向量和第二位置向量,得到图片特征向量;将图片特征向量输入至编码器进行编码,得到编码输出向量;对中文文字信息进行命名实体标注得到文本数据,再进行文本数据编码并叠加序列位置向量编码,得到文本序列;将编码输出向量和文本序列输入至解码器,得到解码输出向量;将解码输出向量输入至条件随机场中进行标签预测,得到图片中文本对应的实体。

Patent Agency Ranking