-
公开(公告)号:CN110502737A
公开(公告)日:2019-11-26
申请号:CN201810478904.3
申请日:2018-05-18
Applicant: 中国医学科学院北京协和医院 , 睿医(北京)数据技术有限公司
IPC: G06F17/27
Abstract: 本发明公开了一种基于医学专业词典与统计算法的分词方法,包括以下步骤:语料预处理、候选词条的表达与产生实现、分词结果判别、分词结果的歧义消除、医学词典的构造和未登录词的发现。本发明有效解决了当前无针对中文医学语料的专用分词方法模型和系统的问题,提升中文医学语料分词准确率、召回率和F值等关键评价指标。
-
公开(公告)号:CN110502737B
公开(公告)日:2023-02-17
申请号:CN201810478904.3
申请日:2018-05-18
Applicant: 中国医学科学院北京协和医院 , 睿医(北京)数据技术有限公司
IPC: G06F40/289
Abstract: 本发明公开了一种基于医学专业词典与统计算法的分词方法,包括以下步骤:语料预处理、候选词条的表达与产生实现、分词结果判别、分词结果的歧义消除、医学词典的构造和未登录词的发现。本发明有效解决了当前无针对中文医学语料的专用分词方法模型和系统的问题,提升中文医学语料分词准确率、召回率和F值等关键评价指标。
-