一种基于中医词典的交叉融合命名实体识别方法

    公开(公告)号:CN116681072A

    公开(公告)日:2023-09-01

    申请号:CN202310641231.X

    申请日:2023-06-01

    Abstract: 本发明属于数据处理技术领域,具体为一种基于中医词典的交叉融合命名实体识别方法。通过构建字符级模型、词级模型、中医词典模型、融合模型,利用上述模型完成命名实体识别任务。其中融合模型是在原有字符级模型和词级模型的基础上,引入中医领域的标准化专有术语词典,并基于该术语词典衍生的两个包含外部词汇的融合模型,通融合模型的引入丰富了模型多样性。将字符级模型与第一融合模型看成一组,词级模型对应第二融合模型看成第二组,两组交替与中医词典模型组合训练,完善标注结果;并融合所有标注结果来获取最终预测序列,完成命名实体识别。有效提升了识别准确度和鲁棒性。

    一种中医辨证数据生成方法与系统

    公开(公告)号:CN113707331B

    公开(公告)日:2023-04-07

    申请号:CN202110874696.0

    申请日:2021-07-30

    Abstract: 本发明公开了一种中医辨证数据生成方法与系统,数据生成方法包括以下步骤:S1、数据获取与预处理,S2、构建特征症状的隐藏分布:将症状数据输入到编码器的其中一个全连接神经网络得到中间隐藏层,然后将隐藏层表示输入到编码器的另外两个全连接神经网络分别输出均值和方差,基于均值和方差,得到隐藏分布z;S3、重构特征症状;S4、构建全连接标签模型;S5、模型训练:基于重构误差、散度误差和标签损失误差构建模型;S6、生成新的特征症状。本发明在变分自编码器基础上额外增加了一层全连接神经网络,将预测标签和真实标签之间的误差信息引入到变分自编码器的训练之中,以此达到扩充样本的同时保证扩充样本在下游分类任务的性能。

    一种中医辨证数据生成方法与系统

    公开(公告)号:CN113707331A

    公开(公告)日:2021-11-26

    申请号:CN202110874696.0

    申请日:2021-07-30

    Abstract: 本发明公开了一种中医辨证数据生成方法与系统,数据生成方法包括以下步骤:S1、数据获取与预处理,S2、构建特征症状的隐藏分布:将症状数据输入到编码器的其中一个全连接神经网络得到中间隐藏层,然后将隐藏层表示输入到编码器的另外两个全连接神经网络分别输出均值和方差,基于均值和方差,得到隐藏分布z;S3、重构特征症状;S4、构建全连接标签模型;S5、模型训练:基于重构误差、散度误差和标签损失误差构建模型;S6、生成新的特征症状。本发明在变分自编码器基础上额外增加了一层全连接神经网络,将预测标签和真实标签之间的误差信息引入到变分自编码器的训练之中,以此达到扩充样本的同时保证扩充样本在下游分类任务的性能。

Patent Agency Ranking