一种基于知识库的医院信息搜索引擎及系统

    公开(公告)号:CN101441636A

    公开(公告)日:2009-05-27

    申请号:CN200710177798.7

    申请日:2007-11-21

    Abstract: 本发明基于知识库的医疗搜索引擎及系统,抓取中文医疗健康目录构建原始医疗网页库;对原始医疗网页库中的网页进行相关信息抽取,提取对医院、科室、医生的评论信息,构建医疗评论信息库;使用词频统计和调查问卷,对抽取的相关信息进行医疗评论属性字段提取,提取观点短语,观点短语倾向性分析,给出评论评论信息是正面或是反面的分析结果,确定医院、科室、医生的排名;根据医疗知识库对搜索结果进行排序,将高度结构化和高度相关的信息提供给用户。本发明针对通用搜索引擎结果信息是非结构化、相关度和准确度低等缺点,构建医疗知识库,为用户提供高度结构化的医疗信息,提高用户查询医疗信息相关度和准确率,能有效提高搜索结果的准确率和召回率。

    实现观点搜索引擎排序的方法

    公开(公告)号:CN101515269A

    公开(公告)日:2009-08-26

    申请号:CN200810057879.8

    申请日:2008-02-20

    Abstract: 本发明公开了一种实现观点搜索引擎排序的方法,包括:使用网络爬虫对用户评论网页进行抓取,对抓取的网页进行预处理,从预处理后的网页中提取出用户评论信息;使用数据挖掘技术从该用户评论信息中提取产品的属性,并确定属性评论信息的极性,构建评论信息库;转换该评论信息库中所有用户评论信息文档的格式,构建用户评论信息文档的层次结构;对转换以后的用户评论信息建立倒排序索引;对建立倒排序索引的用户评论信息进行排序;对用户评论信息进行统计分析及可视化。利用本发明,有效地融合了用户评论信息的品质因素,并充分考虑了时间维度信息,能够为潜在用户提供更准确、更相关、更及时的观点信息服务。

    实现观点搜索引擎排序的方法

    公开(公告)号:CN101515269B

    公开(公告)日:2011-08-31

    申请号:CN200810057879.8

    申请日:2008-02-20

    Abstract: 本发明公开了一种实现观点搜索引擎排序的方法,包括:使用网络爬虫对用户评论网页进行抓取,对抓取的网页进行预处理,从预处理后的网页中提取出用户评论信息;使用数据挖掘技术从该用户评论信息中提取产品的属性,并确定属性评论信息的极性,构建评论信息库;转换该评论信息库中所有用户评论信息文档的格式,构建用户评论信息文档的层次结构;对转换以后的用户评论信息建立倒排序索引;对建立倒排序索引的用户评论信息进行排序;对用户评论信息进行统计分析及可视化。利用本发明,有效地融合了用户评论信息的品质因素,并充分考虑了时间维度信息,能够为潜在用户提供更准确、更相关、更及时的观点信息服务。

Patent Agency Ranking