一种基于提示学习的命名实体识别方法

    公开(公告)号:CN116384401A

    公开(公告)日:2023-07-04

    申请号:CN202310399388.6

    申请日:2023-04-14

    Abstract: 本发明公开了一种基于提示学习的命名实体识别方法,利用文本表示模型consert计算文本序列和候选样本示例模板的相似度,选择最相似的候选样本示例模板以上下文的形式拼接到文本序列中,使用Transformer‑1编码器编码,通过一层线性映射层映射为实体边界判别向量,并通过条件随机场得到候选实体边界预测值,获得候选实体片段;利用候选实体边界预测值,在文本序列中插入候选实体片段分隔符,构造实体边界感知模板输入,使用Transformer‑2编码器进行编码,平均候选实体片段中的字符向量,得到候选实体片段向量;接着通过一层线性映射层映射为候选实体类别判别向量,并使用softmax函数得到候选实体类别预测值,得到识别出的命名实体。本发明提升了命名实体识别准确率。

    一种基于链接矩阵的跨模态事件联合抽取方法及其系统

    公开(公告)号:CN117009496A

    公开(公告)日:2023-11-07

    申请号:CN202310579818.2

    申请日:2023-05-22

    Abstract: 本发明公开一种基于链接矩阵的多模态事件联合抽取方法,确定应用领域的事件结构体系,构建跨模态事件抽取数据集;构建图像块和文本序列之间的链接矩阵;基于ViLT构建多模态事件抽取模型,其中多模态Transformer编码器以图像块像素特征、词例特征和图像分块‑文本词例对特征为输入,得到多模态特征输入解码器,获取图文事件类型一致性特征、事件类型特征和图文事件要素特征;利用极大似然估计,取最大概率的图文事件类型匹配结果、事件类型、图文事件要素作为索引,利用索引映射得到文本事件信息。本发明解决了弱监督和无监督方法识别精度低,管道式多模态事件要素信息匹配不准确的问题,为多模态信息抽取领域提供了一种新的事件抽取策略。

    一种基于路径扩展的非连续实体识别方法

    公开(公告)号:CN113886522B

    公开(公告)日:2022-12-02

    申请号:CN202111070443.4

    申请日:2021-09-13

    Abstract: 本发明提出了一种基于路径扩展的非连续实体识别方法,对文本序列使用Transformer‑1编码器编码;将Transformer‑1编码器的输出通过一层线性映射层映射为实体首字符判别向量,并使用softmax函数得到字符标签预测值,以获得实体首字符的索引值;针对预测的每个实体首字符,将其对应的Transformer‑1编码器输出向量与其后字符的Transformer‑1编码器输出向量拼接,使用Transformer‑2编码器进行编码,接着通过一层线性映射层映射为实体尾字符判别向量,并使用softmax函数得到字符标签预测值,以获得对应实体首字符的实体尾字符索引值;针对每对实体首字符和实体尾字符区间字符使用路径扩展方法,得到实体表示的路径;解码获得的实体表示路径,得到识别出的实体。本发明避免了解码模糊性问题,提高了识别的准确率。

    一种基于路径扩展的非连续实体识别方法

    公开(公告)号:CN113886522A

    公开(公告)日:2022-01-04

    申请号:CN202111070443.4

    申请日:2021-09-13

    Abstract: 本发明提出了一种基于路径扩展的非连续实体识别方法,对文本序列使用Transformer‑1编码器编码;将Transformer‑1编码器的输出通过一层线性映射层映射为实体首字符判别向量,并使用softmax函数得到字符标签预测值,以获得实体首字符的索引值;针对预测的每个实体首字符,将其对应的Transformer‑1编码器输出向量与其后字符的Transformer‑1编码器输出向量拼接,使用Transformer‑2编码器进行编码,接着通过一层线性映射层映射为实体尾字符判别向量,并使用softmax函数得到字符标签预测值,以获得对应实体首字符的实体尾字符索引值;针对每对实体首字符和实体尾字符区间字符使用路径扩展方法,得到实体表示的路径;解码获得的实体表示路径,得到识别出的实体。本发明避免了解码模糊性问题,提高了识别的准确率。

Patent Agency Ranking