一种基于互补语料的短文本观点挖掘方法

    公开(公告)号:CN106227768A

    公开(公告)日:2016-12-14

    申请号:CN201610559782.1

    申请日:2016-07-15

    Abstract: 本发明公开了一种基于互补语料的短文本观点挖掘方法,是基于属性的观点挖掘;具体为:首先,从某段微博语料中选取训练语料,进行分词处理,词性标注和筛选;根据观点词将训练语料进行属性词的标注;并使用词性标注做为特征训练最大熵模型;然后,针对某个事件的微博语料和新闻语料,构建跨语料的话题模型,并结合最大熵模型,分析该事件所属的话题并提取相应的属性词分布和观点词分布;最后,针对某个具体共享话题的所有观点词或者某个具体独享话题中的所有观点词,利用情感分类器进行极性分析。本发明适用于对舆情事件的属性分析及观点挖掘,具有高效性、鲁棒性和易用性的特点,在观点挖掘、舆情监控等领域具有重要的应用价值。

    一种互联网恶意代码处置方法

    公开(公告)号:CN103942491A

    公开(公告)日:2014-07-23

    申请号:CN201310729190.6

    申请日:2013-12-25

    CPC classification number: G06F21/552 G06F21/56

    Abstract: 本发明公开了一种互联网恶意代码处置方法,包括:步骤S101,匹配可疑样本,计算可疑样本文件的哈希值,与已分析样本进行对比,判断是否已经分析过,如果是,则直接返回该可疑样本的已有分析结果;如果否,则转步骤S102;步骤S102,对于未分析过的可疑样本,调用杀毒引擎进行病毒扫描,判断该可疑样本是否属于已知恶意代码,如果是,则获得该恶意代码的信息;如果否,则转步骤S103;步骤S103,当可疑样本属于未知恶意代码时,进行全面的动态分析,得到恶意代码分析报告。本发明能自动快速分析各种恶意代码,生成恶意代码分析报告,为研究恶意代码防御和清除方法提供依据。

Patent Agency Ranking