一种新型医疗文本预处理系统
    1.
    发明公开

    公开(公告)号:CN114171147A

    公开(公告)日:2022-03-11

    申请号:CN202111446280.5

    申请日:2021-11-30

    Abstract: 本发明提供一种新型医疗文本预处理系统,其特征在于,包括:文本数据;文本预处理,文本预处理的输出端单向连接于文本数据的输入端,文本预处理的输出端单向连接有mord2vec模型生成词向量,mord2vec模型生成词向量的输出端单向连接有堆叠BILSTM模型捕捉上下语境特征,所述堆叠BILSTM模型捕捉上下语境特征的输出端单向连接有CRF模型提取全局最优序列,所述CRF模型提取全局最优序列的输出端单向连接有输出预测命名实体识别序列,S1:所述文本预处理对输入的妊娠糖尿病电子病历文本进行分词。本发明提供的一种新型医疗文本预处理系统,可以获取到包含更丰富、更精准特征信息的文本表示,使得妊娠糖尿病电子病历的命名实体识别效果更加精准。

    一种基于混合神经网络的事件抽取方法

    公开(公告)号:CN115169348A

    公开(公告)日:2022-10-11

    申请号:CN202210726176.X

    申请日:2022-06-24

    Abstract: 本发明公开了一种基于混合神经网络的事件抽取方法,具体涉及自然语言文本处理技术领域,包括步骤一:对原始文本进行数据预处理,并对原始文本进行分句,得到事件句,再对事件句进行分词、命名体识别,并将事件句序列转换为词向量的形式;步骤二:将以词向量表示的事件句序列传入到双向长短时记忆网络,即(前向和后向两个子LSTM网络),再利用BERT模型来捕捉字级别的语义特征。本发明利用BERT模型来解决一词多义的问题,且充分考虑了卷积神经网络有效提取文本局部特征与BILSTM网络提取文本全局特征的优势,以及文本在上下文语义中的信息,有效提取了文本的特征。模糊上下文语义的情况被解决,提高了事件抽取的效果。

Patent Agency Ranking