基于深度学习及分布式语义特征医学信息抽取系统及方法

    公开(公告)号:CN105894088B

    公开(公告)日:2018-06-29

    申请号:CN201610176409.8

    申请日:2016-03-25

    Inventor: 吴永辉 王璟琪

    Abstract: 本发明公开了基于深度学习及分布式语义特征医学信息抽取系统和方法,包含预处理模块、基于语言模型的词向量训练模块、海量医学知识库加强学习模块和基于深度人工神经网络的医学名实体识别模块;通过深度学习方法以生成语言模型的概率为优化目标,使用医学文本大数据训练初级的词向量;基于海量医学知识库,训练第二个深度人工神经网络,通过深度加强学习,把海量知识库结合到深度学习的特征学习过程中,从而获取真对医学领域的分布式语义特征;最后使用基于优化语句级极大似然概率的深度学习方法进行中文医学名实体识别。使用大量未标注语料来生成词向量,从而避免医学自然语言处理中的繁琐的特征选择和调优过程。

    基于深度学习及分布式语义特征医学信息抽取系统及方法

    公开(公告)号:CN105894088A

    公开(公告)日:2016-08-24

    申请号:CN201610176409.8

    申请日:2016-03-25

    Inventor: 吴永辉 王璟琪

    Abstract: 本发明公开了基于深度学习及分布式语义特征医学信息抽取系统和方法,包含预处理模块、基于语言模型的词向量训练模块、海量医学知识库加强学习模块和基于深度人工神经网络的医学名实体识别模块;通过深度学习方法以生成语言模型的概率为优化目标,使用医学文本大数据训练初级的词向量;基于海量医学知识库,训练第二个深度人工神经网络,通过深度加强学习,把海量知识库结合到深度学习的特征学习过程中,从而获取真对医学领域的分布式语义特征;最后使用基于优化语句级极大似然概率的深度学习方法进行中文医学名实体识别。使用大量未标注语料来生成词向量,从而避免医学自然语言处理中的繁琐的特征选择和调优过程。

Patent Agency Ranking