-
公开(公告)号:CN102662969B
公开(公告)日:2013-11-27
申请号:CN201210061434.3
申请日:2012-03-11
Applicant: 复旦大学
Abstract: 本发明属于互联网技术领域,具体为一种基于网页结构语义的互联网信息对象定位方法。本发明方法首先将检索到的相关网页的HTML代码转换为DOM树结构;然后根据互联网信息对象语义词典为每个文本节点进行语义匹配,分配不同的语义角色,对每一个DOM树的内部节点(非叶节点)计算其结构语义熵值,以衡量其语义丰富程度;最后综合熵值与网页的层次结构关系,反映某个节点内语义信息的聚集程度,在大量网页中判断指定信息对象所在的网页区域,进而抽取出所需数据。本发明的一种应用实例是互联网药品信息搜索和分析。
-
公开(公告)号:CN103606097A
公开(公告)日:2014-02-26
申请号:CN201310586279.1
申请日:2013-11-21
Applicant: 复旦大学
Abstract: 本发明属于数据处理技术领域,具体为一种基于可信度评价的产品信息推荐方法及系统。本发明方法基于互联网产品信息可信度评价模型和产品信息描述规范,对完整度、规范度、违规程度和用户满意度四个评价指标进行量化评估,建立推荐规则,向用户推荐互联网产品信息。本发明还提供一种基于可信度评价的互联网产品信息推荐系统。本发明从多个维度评价互联网产品信息的可信度,与单一维度的可信度评价方法相比,对产品信息可信度的评价更加全面。本发明可用于评价互联网产品信息的可信度,为消费者推荐可信度评价较高的产品信息,能够有效降低用户在线购物风险,提高产品信息推荐的效率和准确度。
-
公开(公告)号:CN102662969A
公开(公告)日:2012-09-12
申请号:CN201210061434.3
申请日:2012-03-11
Applicant: 复旦大学
Abstract: 本发明属于互联网技术领域,具体为一种基于网页结构语义的互联网信息对象定位方法。本发明方法首先将检索到的相关网页的HTML代码转换为DOM树结构;然后根据互联网信息对象语义词典为每个文本节点进行语义匹配,分配不同的语义角色,对每一个DOM树的内部节点(非叶节点)计算其结构语义熵值,以衡量其语义丰富程度;最后综合熵值与网页的层次结构关系,反映某个节点内语义信息的聚集程度,在大量网页中判断指定信息对象所在的网页区域,进而抽取出所需数据。本发明的一种应用实例是互联网药品信息搜索和分析。
-
-