-
公开(公告)号:CN107066554B
公开(公告)日:2020-12-15
申请号:CN201710183767.6
申请日:2017-03-24
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F16/30
Abstract: 本发明公开了一种微博相关人物推荐方法,包括:步骤一、微博用户识别:解析当前用户所有博文中的多个关键字以及每个关键字的权重Wki;获取至少一篇相匹配博文,相匹配的博文具有所述多个关键字,获取各相匹配博文的微博主,再获取各微博主对多个关键字中各关键字的权重UWki;步骤二、相关用户过滤:从所获取的微博主中筛选掉已经被当前用户关注的微博主,从而获得至少一个相关用户;步骤三、用户相关性权重计算:依据相关性权重公式计算每个相关用户的相关性权重;步骤四、根据所述至少一个相关用户的相关性权重,将相关性权重排名在排序规定值之前的相关用户推荐给当前用户。本发明可以使用户更加方便直接地关注自己感兴趣的内容和微博人物。
-
公开(公告)号:CN106980692B
公开(公告)日:2020-12-08
申请号:CN201710213302.0
申请日:2017-04-01
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/9536 , G06Q50/00
Abstract: 本发明涉及一种基于微博特定事件的影响力计算方法,属于社交网络分析及数据挖掘技术领域。本发明依据传播学中事件发展的五个阶段对特定事件进行了相关分析划分并应用于影响力计算中,主要针对微博文本数据及基础的用户数据进行统计处理与自然语言处理,计算传播角度和内容角度兼顾的六项影响力指标,并使用K‑means机器学习算法对子话题进行划分;最终得出特定事件的影响力热度指数EII、事件内的用户影响力排行榜、消息影响力排行榜。对比现有技术,本发明考虑微博文本的内容指标,较全面而准确地反映了事件各方面的信息,具有很强的现实意义和实用价值。此外,本发明方法计算的时空耗费不高,易于模块化,可投入大规模的数据计算,具有较好的稳定性。
-
公开(公告)号:CN111680072A
公开(公告)日:2020-09-18
申请号:CN202010375603.5
申请日:2020-05-07
Applicant: 国家计算机网络与信息安全管理中心 , 北京蓝光汇智网络科技有限公司
IPC: G06F16/2457 , G06F16/215 , G06F16/22 , G06F16/9536
Abstract: 本发明公开了一种基于社交信息数据的划分系统,包括:数据采集装置;数据解析装置,解析社交数据,获取社交信息并进行唯一标识;数据去重装置;多媒体数据转换装置,将去重后的社交信息的多媒体文件提取链接;海量对象存储装置,存储去重后的社交信息;基本数据存储装置,存储去重后的社交信息的标识;分词装置,将去重后的社交信息划分成多个关键词;全文检索装置,将划分的关键词汇总、去重、建立索引。本发明还公开了一种基于社交信息数据的划分方法。本发明还公开了一种电子设备及存储介质。本发明对接收的不同社交媒体的网络信息进行按条件分类显示,方便使用人员更直观的对不同社交媒体的网络信息进行审查。
-
公开(公告)号:CN108566380B
公开(公告)日:2020-08-28
申请号:CN201810212973.X
申请日:2018-03-15
Applicant: 国家计算机网络与信息安全管理中心四川分中心
Abstract: 本发明公开了一种代理上网行为识别与检测方法,包括:初步处理网络中数据,在数据流出时,记录目的地址不在境内的IP,在数据流入时,记录源地址不在境内的IP;将数据流出时和数据流入时记录的IP保存在存储引擎中;储存引擎中的IP数据再提供给分析引擎,供分析引擎进行分析;将标识为可疑访问会话的数据流入方向的源地址加入到应用识别引擎中去进行应用识别;调用协议验证引擎进行协议验证,若验证出有协议为伪装协议,则判定境外IP为代理服务器访问会话或者判定境外IP为代理服务器访问会话的可疑度高。本发明方法能够精准地识别使用全局代理访问出口以外网站的用户及代理服务器。
-
公开(公告)号:CN106126605B
公开(公告)日:2019-12-10
申请号:CN201610453205.4
申请日:2016-06-21
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35
Abstract: 本发明公开了一种基于用户画像的短文本分类方法。本方法为:1)基于用户发出的短文本数据生成对应用户的用户画像;其中,用户ui的用户画像为用户ui属于类别ci的值;2)采用分类器对该用户ui的短文本TS进行分类,得到该短文本TS所属类别的可能性F={f1,...,fi,...,fm};3)根据用户ui的用户画像与F={f1,...,fi,...,fm}计算该短文本TS属于各类别的值,选出最大的类别结果作为该短文本TS的类别标签。本发明大大增加了分类的准确率。
-
公开(公告)号:CN110442421A
公开(公告)日:2019-11-12
申请号:CN201910578655.X
申请日:2019-06-28
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F9/455
Abstract: 本发明提出一种基于Kubernetes的通用服务转换方法和系统,包括:构建由多个节点构成的Kubernetes系统,其中节点的Pod设有用于提供服务的原服务容器,并通过在Pod中新添加容器的方式或通过原容器镜像的方式,在节点的Pod中加入转换程序;每当发生一次服务调用请求,转换容器或程序根据配置,将服务调用请求转换为原服务执行请求,通过调用原服务容器,提供相对应的服务,并转换成该服务调用请求所对应的服务结果。本发明可解决Kubernetes服务与调用者之间接口不一致的问题;并可减少转换程序与服务程序、调用程序之间的网络开销,同时结合Kubernetes特性,服务程序重新部署时,转换程序自动跟随部署。
-
公开(公告)号:CN110414680A
公开(公告)日:2019-11-05
申请号:CN201910667447.7
申请日:2019-07-23
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了基于众包标注的知识加工系统,包括:粗知识管理模块,其用于导入待标注知识;任务发布模块,其用于生成标注任务并发布,所述标注任务包括待标注知识、标注员、审核员和标注字段;知识标注模块,其用于对所述标注任务进行标注处理,并将已处理的标注任务生成审核任务;知识审核模块,其用于对所述审核任务对应的标注结果进行审核处理。本发明采用众包标注的形式进行知识加工,加工过程辅以机器学习进行自动抽取,通过人机结合的知识加工过程,形成有效的综合知识库。
-
公开(公告)号:CN110287314A
公开(公告)日:2019-09-27
申请号:CN201910418900.0
申请日:2019-05-20
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/35
Abstract: 本发明涉及一种基于无监督聚类的长文本可信度评估方法,包括:以已知长文本获取训练数据,提取该训练数据的训练特征以构建训练特征向量集,对该训练特征向量集进行无监督聚类,得到多个训练类心;以待评估长文本获取评估数据,提取该评估数据的评估特征向量;获取该评估特征向量相对该训练类心的评估值,并以该评估值得到该待评估长文本的可信度。本发明通过无监督聚类对长文本进行可信度评估,在实施过程中不需要标注数据,节省了人力、物力与时间,避免了数据中标签稀疏带来的困扰;提取了长文本的文本特征,对于可信度评估任务更加适用,使用该模型得到的文本的可信度更具有可解释性,同时在平台之间可以迁移。
-
公开(公告)号:CN105893481B
公开(公告)日:2019-01-29
申请号:CN201610187149.4
申请日:2016-03-29
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提供一种基于马尔可夫聚类的实体间关系消解方法,包括:计算K个实体中任意两个实体之间的语义相似度;根据实体间的语义相似度构造赋权图G;构造状态转移矩阵M;在状态转移矩阵M上执行马尔科夫聚类算法,得到多个关系簇;其中,每个簇代表一系列语义相近似的实体。本发明提供的基于马尔可夫聚类的实体间关系消解方法具有以下优点:提出了融合词法和语义的相似度计算方法,然后给出了基于马尔科夫图聚类的关系聚类方法。该方法与层次聚类方法相比,聚类纯度指标有了一定提高,还具有计算过程简单快速的优点。
-
公开(公告)号:CN107577782A
公开(公告)日:2018-01-12
申请号:CN201710827978.9
申请日:2017-09-14
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明公开了一种基于异质数据的人物相似度刻画方法,属于数据挖掘领域。本发明首先搜集用户的微博文本,获取用户之间的关注关系以及各用户的基本信息,针对不同类型数据的特点个性化选择处理方式,并对于微博文本采用Doc2vec模型,结合上下文信息将文本表示成向量,再根据定义的相似度函数衡量相似度,最后将不同维度得到的矩阵进行融合,刻画用户最终的相似度。本发明引入了多种社交网络信息,包括社交关系数据、用户属性数据和用户文本数据等,通过对不同类型的信息加以综合考虑,以得到更全面的人物相似度刻画方法;同时本发明提供了对于多种数据的处理和计算方案,利用完整的数据和加权融合方法,个性化计算不同偏好的人物相似度。
-
-
-
-
-
-
-
-
-