-
公开(公告)号:CN104965992A
公开(公告)日:2015-10-07
申请号:CN201510410117.1
申请日:2015-07-13
Applicant: 南开大学
Abstract: 本发明公开了一种基于在线医疗问答信息的文本挖掘方法,所述文本挖掘方法包括以下步骤:采用基于DOM和网页模板的网络数据抽取方式对已获取的原网页进行疾病问答信息的提取;在提取的疾病问答信息中通过条件随机场模型的特征,进行医疗命名实体识别;通过医疗命名实体识别对医疗实体关系进行挖掘。本方法可以有效获取各类实体之间潜在的关联关系。该方法适用于所有疾病类别的挖掘工作,而且具有一定的可扩展性。
-
公开(公告)号:CN104965992B
公开(公告)日:2018-01-09
申请号:CN201510410117.1
申请日:2015-07-13
Applicant: 南开大学
Abstract: 本发明公开了一种基于在线医疗问答信息的文本挖掘方法,所述文本挖掘方法包括以下步骤:采用基于DOM和网页模板的网络数据抽取方式对已获取的原网页进行疾病问答信息的提取;在提取的疾病问答信息中通过条件随机场模型的特征,进行医疗命名实体识别;通过医疗命名实体识别对医疗实体关系进行挖掘。本方法可以有效获取各类实体之间潜在的关联关系。该方法适用于所有疾病类别的挖掘工作,而且具有一定的可扩展性。
-