一种基于实体类型信息的医疗实体关系联合抽取方法

    公开(公告)号:CN113486667B

    公开(公告)日:2024-03-05

    申请号:CN202110846235.2

    申请日:2021-07-26

    Abstract: 本发明提供了一种基于实体类型信息的医疗实体关系联合抽取方法,包括对医疗文本数据集进行预处理;将训练数据句子中的每一个词转化成对应的词向量,构建词嵌入层;根据医疗文本的词向量表示,获取具有特征信息的文本特征向量表示;通过分层的指针标注方法,并融合实体类型信息,抽取出医学文本中的关系三元组。本发明将实体类型信息加入到医疗实体关系联合抽取训练模型中,实体类型信息与上下文信息对于关系抽取模型同样重要,融合了实体类型信息的模型使得实体与关系之间的依赖性更强,联系更为紧密,增强了实体关系抽取模型的性能;基于分层的指针网络模型,将关系建模为主语到宾语的映射,较好的处理医疗文本数据中存在的实体关系重叠问题。

    一种基于实体类型信息的医疗实体关系联合抽取方法

    公开(公告)号:CN113486667A

    公开(公告)日:2021-10-08

    申请号:CN202110846235.2

    申请日:2021-07-26

    Abstract: 本发明提供了一种基于实体类型信息的医疗实体关系联合抽取方法,包括对医疗文本数据集进行预处理;将训练数据句子中的每一个词转化成对应的词向量,构建词嵌入层;根据医疗文本的词向量表示,获取具有特征信息的文本特征向量表示;通过分层的指针标注方法,并融合实体类型信息,抽取出医学文本中的关系三元组。本发明将实体类型信息加入到医疗实体关系联合抽取训练模型中,实体类型信息与上下文信息对于关系抽取模型同样重要,融合了实体类型信息的模型使得实体与关系之间的依赖性更强,联系更为紧密,增强了实体关系抽取模型的性能;基于分层的指针网络模型,将关系建模为主语到宾语的映射,较好的处理医疗文本数据中存在的实体关系重叠问题。

    一种基于GAN的融合NDCT噪声的低剂量CT双域联合降噪方法

    公开(公告)号:CN114004753B

    公开(公告)日:2022-07-01

    申请号:CN202111043544.2

    申请日:2021-09-07

    Abstract: 本发明提供了一种基于GAN网络的融合NDCT噪声的低剂量CT循环多次降噪方法,包括S1:构建低剂量CT图像和正常剂量CT图像的样本集;S2:训练预测CT图像噪声的网络;S3、S4:对LDCT图像进行初步降噪;S5:除去NDCT图像中的噪声;S6:通过两个生成对抗网络(WGAN)分别对时域和频域上的CT图像进行训练;S7:对两个WGAN的目标函数进行优化,得到更优的降噪效果。通过本发明的技术方案,本发明内容主要包括两部分,一是对LDCT进行粗粒度处理,为下一步减轻负担;二是利用频域变化可以分离图像的细节信息和结构信息的特点,使用双域联合降噪对LDCT进行进一步细粒度处理,目的是提高降噪效果的同时弥补降噪过程所导致的边缘模糊、部分细节丢失的不足。

    融合部首向量的分词和胶囊网络法律命名实体识别方法

    公开(公告)号:CN113312918B

    公开(公告)日:2022-05-17

    申请号:CN202110647232.6

    申请日:2021-06-10

    Abstract: 本发明提供了一种融合部首向量的分词和胶囊网络法律命名实体识别方法,其特征在于,具体包括以下步骤:S1:分词;S2:构建法律数据集;S3:提取句间特征;S4:提取句子内部特征H;S5:将语料句子内部特征和句间特征联合表示。通过本发明的技术方案,提升词向量的表征能力,使特征提取阶段不需要繁杂的网络,结构就能得到丰富的上下文信息,提升了小规模领域标注数据集上的分词效果,帮助NER任务进行数据预处理,找到准确的实体边界,增强模型在法律领域的适应性,能够在具有特殊实体表示形式和构词方法的法律领域实现精度较高的命名实体识别结果。法律领域的命名实体识别可以在智能司法中起到重要的帮助作用,帮助提取文本中的关键信息。

    融合部首向量的分词和胶囊网络法律命名实体识别方法

    公开(公告)号:CN113312918A

    公开(公告)日:2021-08-27

    申请号:CN202110647232.6

    申请日:2021-06-10

    Abstract: 本发明提供了一种融合部首向量的分词和胶囊网络法律命名实体识别方法,其特征在于,具体包括以下步骤:S1:分词;S2:构建法律数据集;S3:提取句间特征;S4:提取句子内部特征H;S5:将语料句子内部特征和句间特征联合表示。通过本发明的技术方案,提升词向量的表征能力,使特征提取阶段不需要繁杂的网络,结构就能得到丰富的上下文信息,提升了小规模领域标注数据集上的分词效果,帮助NER任务进行数据预处理,找到准确的实体边界,增强模型在法律领域的适应性,能够在具有特殊实体表示形式和构词方法的法律领域实现精度较高的命名实体识别结果。法律领域的命名实体识别可以在智能司法中起到重要的帮助作用,帮助提取文本中的关键信息。

Patent Agency Ranking