-
公开(公告)号:CN107168986A
公开(公告)日:2017-09-15
申请号:CN201710178505.0
申请日:2017-03-23
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明公开了一种新闻APP应用活跃度的分析方法,包括以下步骤:步骤1、采集不少于2个新闻APP的相关数据;步骤2、将步骤1采集的数据代入活跃度计算模型进行分析计算;步骤3、将步骤2中得到的计算结果进行排列,即得所采集新闻APP的活跃度排行。其能够综合客观的判断一个新闻APP的实际活跃度,并对多个新闻APP的活跃度进行分析和排行,使用户方便的选择适合自身的新闻APP。
-
公开(公告)号:CN107153908A
公开(公告)日:2017-09-12
申请号:CN201710186473.9
申请日:2017-03-24
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: G06Q10/06393 , G06F17/3089 , G06Q50/01
Abstract: 本发明公开了一种移动新闻App影响力评级方法,步骤包括:1)采集新闻APP上的数据,并将数据聚类入库,所述数据包括:所属网站、评论次数、转载次数、日均访问量(PV)和访问量(UV);2)计算新闻影响力因子;3)利用PageRank算法计算新闻App转载率;4)通过查询回复率参考表得出新闻App回复率;5)利用计算模型计算新闻APP得分,根据分数将新闻App排序。本发明以分数的形式展现给用户,更加直白的显示出不同的新闻App的影响力。这个数值就是新闻App的评价分,分数越高的新闻App,越能满足用户的需求,可以及时的为大众提供实时新闻。
-
公开(公告)号:CN103678565B
公开(公告)日:2017-02-15
申请号:CN201310659722.3
申请日:2013-12-09
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
Abstract: 一种基于自引导方式的领域自适应句子对齐系统,包括:网页处理模块,中文文本处理模块,英文文本处理模块和双语文处理模块。首先,针对不同的网页,对于料进行提取和相应做预处理;使用一种基于自引导的方式并融合多种特征的句子对齐算法对中英文进行句子级的对齐;同时,对可能能够反映相关领域信息和主题信息的互译词对进行提取。本发明提高了句子对齐质量,具有领域适应性强的优点。
-
公开(公告)号:CN103678564B
公开(公告)日:2017-02-15
申请号:CN201310659651.7
申请日:2013-12-09
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
IPC: G06F17/30
Abstract: 一种基于数据挖掘的互联网产品调研系统,由6个模块组成:信息采集模块、信息预处理模块、产品概貌分析模块、情感分析模块、用户行为分析模块和数据展示模块。系统通过自动采集互联网上各类关于产品的信息,经过预处理之后,采用数据挖掘和自然语言处理技术进行综合分析,从而快速形成关于产品的概貌分析、产品各不同功能的市场口碑分析、不同产品对比分析、用户群体分析等不同侧面的分析结果,为产品分析、市场决策提供快速、坚实的支撑。本发明充分利用互联网信息资源优势,能够根据用户需求对产品进行调研,不但可以节约调研所需的人力物力,还能够及时反映跟踪市场动态。
-
公开(公告)号:CN106126606A
公开(公告)日:2016-11-16
申请号:CN201610453319.9
申请日:2016-06-21
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明公开了一种短文本新词发现方法。本方法为:1)从当前短文本中提取一字符串s,计算该字符串s的对称条件概率SCP(s)以及该字符串s的左邻熵HL(s)和右邻熵HL(s);2)取左邻熵HL(s)和右邻熵HL(s)的较小值,记为BE(s);3)计算该字符串s的成词概率Prword(s),根据Prword(s)的值确定词s是否为新词。本发明大大提高了新词发现的准确率。
-
公开(公告)号:CN105912644A
公开(公告)日:2016-08-31
申请号:CN201610217911.9
申请日:2016-04-08
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
CPC classification number: G06F16/345 , G06F17/2775
Abstract: 本发明公开了一种网络评论产生式摘要方法。首先,基于标点符号对评论进行短语分割、分词并标记每个词语的词性,进而基于评论对象参数字典和句法模板过滤掉与评论对象无关的短语;然后,计算短语情感极性强度值,根据评论对象参数的所有短语的情感极性强度值对评论对象参数的重要性进行排序,选取最重要的一部分参数进行摘要生成;最后,针对选取的每个参数,选取一个对该参数最重要的一个评论短语,把选取的所有短语置入到设计好的摘要模板中以生成评论摘要。本发明综合利用了情感分析、词性分析等技术提取有效的用户评论信息,并根据设计好的模板生成摘要,对提高摘要的可读性和准确性有很大帮助。
-
公开(公告)号:CN105843957A
公开(公告)日:2016-08-10
申请号:CN201610236172.8
申请日:2016-04-15
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明实施例提供一种微博深度分类方法及系统,该方法包括:将分词处理后的第一微博训练样本数据分别与各第一筛选词库进行词汇匹配,确定所述第一微博训练样本数据在所述各第一筛选词库中出现的词汇频率;将所述第一微博训练样本数据在所述各第一筛选词库中出现的词汇频率进行归一化处理,并将归一化处理后的数据输入学习模型;根据所述学习模型的输出确定微博事件分类模型;根据所述微博事件分类模型对微博文本进行分类。本发明实施例提供的微博深度分类方法及系统,能够对微博文本进行深入的细化分类,提高微博文本的分类正确率。
-
公开(公告)号:CN105824801A
公开(公告)日:2016-08-03
申请号:CN201610150794.9
申请日:2016-03-16
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: G06F17/2785 , G06F16/288
Abstract: 本发明提供一种基于自动机的实体关系快速抽取方法,包括以下步骤:步骤1,定制规则文件;步骤2,对规则文件中的各个规则进行文法检查,检测规则文件中的各个规则是否满足文法要求,如果满足,则执行步骤3;步骤3,对通过文法检查的所述规则文件中的各个规则进行语义解释;步骤4,将语义解释后的所述规则文件中的各个规则进行解析编译,完成规则向层叠有限状态自动机的转换,得到有限状态自动机;步骤5,使用所述有限状态自动机,对输入的文本数据进行实体属性以及实体关系的抽取,得到最终的实体属性以及实体关系。优点为:能够保证对开放域文本进行快速的实体关系与实体属性抽取。同时,对于特定领域的实体关系可以定制化的进行抽取。
-
公开(公告)号:CN105608107A
公开(公告)日:2016-05-25
申请号:CN201510744625.3
申请日:2015-11-05
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F17/30905
Abstract: 本发明公开了一种基于舆情大数据的视觉展示方法。获取舆情大数据的数据变化值;确定用于显示所述数据的变化值的时间长度;根据所述数据的变化值和时间长度,确定所述立体模型的变化速度。本发明能够形象地展示数据的变化值和变化速度,从而将数据的变化以视觉变化来展现,增强了使用者和浏览的用户的视觉体验。
-
公开(公告)号:CN118780275A
公开(公告)日:2024-10-15
申请号:CN202410586391.3
申请日:2024-05-13
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/279 , G06F40/30 , G06F16/35 , G06F18/25 , G06F18/2433 , G06N3/0442 , G06N3/08
Abstract: 本发明涉及数据识别与检测领域,尤其涉及一种舆情态势数据智能识别及异常检测方法,包括以下步骤:S1:采用多策略数据抽取方法,处理不同格式的数据源;引入自适应语义映射机制,通过语义深度调节因子SDF动态调整每个词的语义向量vi,使动态语义融合网络捕获更加丰富和准确的语义信息;S2:时间序列异常态势预测器通过融合动态解码模型TSIM,结合时间‑语义交互机制,将文本的语义信息与时间信息进行深度融合,评估舆情态势,预测及判断舆情态势异常,本方法大幅提升数据处理的准确性和工作效率,有利于及时发现并响应舆情异常,准确预测及判断舆情异常态势。
-
-
-
-
-
-
-
-
-