-
公开(公告)号:CN105162676A
公开(公告)日:2015-12-16
申请号:CN201510363826.9
申请日:2015-06-26
Applicant: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种微信数据获取方法和系统,通过安卓平台应用测试组件和浏览器测试组件相结合来实现。基于安卓平台测试组件方式,可以模拟用户行为操作客户端,包括登陆、查看、滑屏等;由此方式获取的微信公众平台账号历史消息的网页地址结合主动采集技术,可获取微信公众账号完整的历史消息。采用安卓平台测试组件和浏览器测试组件相结合方式,通过监听浏览器DOM元素变化,能够自动化实现网页版微信登陆,全面和及时有效地获取微信数据。
-
公开(公告)号:CN105095988A
公开(公告)日:2015-11-25
申请号:CN201510379930.7
申请日:2015-07-01
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明适用于网络信息传播检测技术领域,提供了一种社交网络信息爆发检测方法,包括:采集社交网络的结构和用户产生内容;构建用户的话题传播概率矩阵;获取社交网络中用户发布或转发的消息;根据消息的转发标志和时间信息构建消息的传播轨迹;根据所述话题传播概率矩阵构建消息传播矩阵;根据所述消息的传播轨迹和消息传播矩阵,分析消息爆发的可能性。本发明还相应的提供一种实现上述方法的社交网络信息爆发检测系统。借此,本发明可以有效的预测社交网络消息是否会爆发传播。
-
公开(公告)号:CN105045803A
公开(公告)日:2015-11-11
申请号:CN201510278653.0
申请日:2015-05-27
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: G06F17/30864 , G06F17/30887 , G06Q50/01
Abstract: 本发明公开了一种社交网络关系的采集方法及系统,所述方法包括:根据预设微博用户信息,通过模拟移动终端浏览器登录预设微博;设置目标微博用户的粉丝URL和/或关注URL;在登录预设微博的所述模拟移动终端浏览器中,根据设置的URL向微博服务器发请求,获得所述微博服务器返回的HTML界面;根据获得的HTML界面,获取所述目标微博用户的粉丝信息和/或所述目标微博用户的关注用户信息。本发明消除了微博服务器的访问频率限制,可以无限制的向服务器发送数据请求;降低了实现难度,不需要逆向分析和大量的调试。
-
公开(公告)号:CN104951505A
公开(公告)日:2015-09-30
申请号:CN201510260191.X
申请日:2015-05-20
Applicant: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F17/30598 , G06F17/30283
Abstract: 本发明公开了一种基于图计算技术的大规模数据聚类方法。本方法为:1)从待处理图数据的所有顶点中选取N个顶点作为候选聚类中心;2)设置每一候选聚类中心的簇标签值,然后根据一加权无向图G将候选聚类中心合并,将属于同一聚类簇的候选聚类中心划分到同一集合中;3)候选聚类中心将包含自己当前簇标签值以及权重的消息传递给相邻顶点;收到消息的顶点根据簇标签值将本次迭代收到的所有消息分成不同的类别,然后生成新的消息并在下一迭代时传递给相邻顶点;4)迭代结束后,对于每一顶点,计算具有相同标签类型的边的权重之和,得到每一顶点最后的结果值;将具有相同结果值的顶点聚为一类。本发明节约了时间和存储开销。
-
公开(公告)号:CN104933475A
公开(公告)日:2015-09-23
申请号:CN201510275958.6
申请日:2015-05-27
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种网络转发行为预测方法及装置。该方法包括:计算待预测用户的转发行为与热点事件趋势的第一匹配度,并计算待预测微博与热点事件的第二匹配度;将第一匹配度、第二匹配度、以及待预测用户的信息输入到预先训练好的分类器中,输出待预测用户对待预测微博的动作类型。借助于本发明的技术方案,有效提高了微博转发行为预测的准确性。
-
公开(公告)号:CN104915397A
公开(公告)日:2015-09-16
申请号:CN201510284821.7
申请日:2015-05-28
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: G06F16/951 , G06Q10/04
Abstract: 本发明提供一种微博传播趋势预测方法及装置,用于解决现有技术中对微博传播趋势预测的方法准确性较低的问题,该方法包括:获取待预测微博的基本属性特征以及传播过程特征;计算待预测微博与训练数据的基本属性特征、传播过程特征的相似度,并对待预测微博数据进行分类,得到待预测微博所属的传播过程类别,传播过程类别由训练数据的传播过程特征相似度聚类得到;为分类后的待预测微博选择对应的回归模型,对待预测微博的传播趋势进行预测,回归模型为预先根据各类训练数据建立的回归模型,该方案提高了微博传播趋势预测的准确性。
-
公开(公告)号:CN104699689A
公开(公告)日:2015-06-10
申请号:CN201310651479.0
申请日:2013-12-04
Applicant: 国家计算机网络与信息安全管理中心 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本发明提供一种数据处理方法及装置,其中,方法包括:接收处理请求,所述处理请求包括待审课题的标识,待审单位信息和评审时间信息;根据所述处理请求,查询预先统计的各课题所属的研究领域和各用户的用户数据,确定所述各用户中的第一用户;将所述第一用户确定为所述待审课题的评审用户。通过本发明提供的数据处理方法及装置,无需人工进行筛选,快速准确地确定出评审待审课题的评审用户,进而节约人力物力资源,有效提高课题评审的效率。
-
公开(公告)号:CN110941721B
公开(公告)日:2022-09-20
申请号:CN201910928700.X
申请日:2019-09-28
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/36 , G06F16/31 , G06F40/216 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于变分自编码主题模型的短文本主题挖掘方法及系统。该方法充分利用神经网络结构的优点,在变分自编码主题模型中融入了预训练的词向量和知识图谱中的实体向量表示,可以帮助主题模型改善短文本特征稀疏导致的文本挖掘问题,较好地挖掘短文本的潜在语义信息。
-
公开(公告)号:CN110781297B
公开(公告)日:2022-06-21
申请号:CN201910881086.6
申请日:2019-09-18
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种基于层次判别树的多标签科研论文的分类方法,包括:步骤一、获取标签已知的论文和标签,提取标签的特征词语集合,构建二元判别模型;步骤二、将标签更新为二元判别模型,得层次判别树模型;步骤三、获取标签未知论文的文本表征,输入到层次判别树模型中根节点的所有二元判别模型中,计算具有该节点对应标签的概率,若大于阈值,则输出该根节点对应的标签;输入至该标签对应的节点的子节点的所有二元判别模型中,计算具有该节点代表标签的概率,若大于阈值,则输出该子节点对应的标签,逐级判断,直至叶节点;输出的所有标签即为该论文的标签。本发明具有充分挖掘论文的特征词语,快速、准确对论文进行层次分类的有益效果。
-
公开(公告)号:CN107944559B
公开(公告)日:2021-04-27
申请号:CN201711190865.9
申请日:2017-11-24
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及一种实体关系自动识别方法及系统,该方法包括:训练卷积神经网络得到实体关系识别模型;获取对应待确认实体组的相关语料库;将相关语料进行分词,并将分词得到的相关词语转化为相关词向量;将相关词向量按相关语料转化为矩阵作为实体关系识别模型的输入,得到相关关系种类和相关关系种类的相似度值,将相似度值高的相关关系种类作为待确认实体组的关系种类。本发明通过锻炼卷积神经网络作为实体关系识别模型,在出现新增实体时,计算得到一系列新增实体组的关系种类,并得出每一项关系种类的相似度值,通过具体的数值来确定相关关系种类的程度,提高得到的新增实体组之间关系种类的准确性。
-
-
-
-
-
-
-
-
-