一种网络不良信息的过滤方法及装置

    公开(公告)号:CN102567304A

    公开(公告)日:2012-07-11

    申请号:CN201010621142.1

    申请日:2010-12-24

    CPC classification number: G06F17/24 G06F17/2705 G06F17/30699 G06F17/30867

    Abstract: 本发明公开了一种网络不良信息的过滤方法以及装置,涉及计算机信息处理及信息过滤技术领域。其中,本发明实施例提供的一种网络不良信息的过滤方法,包括:获取待过滤文本信息、系统预研模型信息以及用户反馈模型信息;对所述待过滤文本信息进行预处理;将所述预处理后的待过滤文本信息与所述系统预研模型信息进行特征信息匹配,给出第一匹配结果;将所述预处理后的待过滤文本信息与所述用户反馈模型信息进行特征信息匹配,给出第二匹配结果;根据所述第一匹配结果与所述第二匹配结果,对所述待过滤文本信息进行过滤处理。采用本发明实施例能够实现提高不良信息自动过滤性能,且可以实现系统信息自动更新。

    一种网络文章传播影响力的评价系统及方法

    公开(公告)号:CN102541912A

    公开(公告)日:2012-07-04

    申请号:CN201010609219.3

    申请日:2010-12-17

    Abstract: 本发明实施例提供一种网络文章传播影响力的评价系统及方法,涉及互联网领域,能够代替人工进行网络文章传播影响力评价,提高了评价效率及评价精度。其网络文章传播影响力的评价系统,包括:数据采集单元,用于对预设站点下的栏目进行数据采集;文章录入单元,用于录入待评价的文章;关键词提取单元,用于提取关键词;评价分析单元,用于根据所述关键词找出所述待评价文章的转载文章,并根据各转载文章的传播影响力评价相关项得到所述待评价文章的传播影响力指数。本发明实施例用于评价网络文章传播影响力。

    一种从新闻列表页抽取新闻记录元数据的方法及系统

    公开(公告)号:CN102467501A

    公开(公告)日:2012-05-23

    申请号:CN201010530643.9

    申请日:2010-10-29

    Abstract: 本发明公开了一种从新闻列表页抽取新闻记录元数据的方法及系统。本发明首先获取目标新闻列表页的网页源代码,按照所述网页源代码对应的HTML文本顺序生成HTML标签树;然后遍历所述HTML标签树,计算每个HTML标签子树的文本链接比得分,将文本链接比得分大于设定阈值的标签子树进行合并,获取一棵最大候选子树;最后从所述最大候选子树中抽取新闻记录元数据列表。采用本发明,用户只需输入新闻列表页,无需配置模板即可得到新闻记录,完全实现了新闻资讯网站列表页新闻记录抽取的自动化、无人化。而且无需关心新闻网站将来是否改版,极大降低了维护和使用成本。

Patent Agency Ranking