-
公开(公告)号:CN108763319B
公开(公告)日:2022-02-08
申请号:CN201810396753.7
申请日:2018-04-28
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/335 , G06N3/04 , G06Q50/00
Abstract: 本发明属于计算机技术领域,具体提供了一种融合用户行为和文本信息的社交机器人检测方法和系统。旨在解决现有技术手动选取特征、忽略社交媒体帖子之间的逻辑性和时序性以及忽略社交平台用户行为信息的问题,本发明的社交机器人的检测方法包括获取待检测社交媒体用户的历史网络数据和好友网络数据;基于上述数据得到用户文本特征向量、行为特征向量以及好友网络特征向量,并将其融合,得到待检测社交媒体用户的用户特征向量;对用户特征向量进行检测,输出检测结果。本发明的方法更加符合社交媒体自身的特性,从多个维度分析待检测社交媒体用户,提升了检测准确率。本发明的系统同样具有上述有益效果。
-
公开(公告)号:CN109800431A
公开(公告)日:2019-05-24
申请号:CN201910062802.8
申请日:2019-01-23
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明属于计算机科学技术领域,尤其是涉及一种事件信息关键词提取方法、监控方法、及其系统和装置,旨在为了解决解决无监督方法提取关键词效果不稳定的问题。本发明提取方法对于获取的待监控的事件信息,基于多种关键词提取技术提取并优选一组相关性很强的关键词作为第一关键词组,而后基于关键词在时域的发展演化选出最新的热点词汇作为第二关键词组,再后对同一时间段内的同一事件的不同报道进行聚类,提取各聚类的关键词合并后作为第三关键字组,最后合并三个关键词组并选定最终的关键词组合。本发明提高了系统的稳定性,同时兼顾了时域及同一事件不同侧面的发展方向。
-
公开(公告)号:CN111859980A
公开(公告)日:2020-10-30
申请号:CN202010549951.X
申请日:2020-06-16
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/30 , G06F40/289 , G06F16/9536 , G06N3/04 , G06N3/08
Abstract: 本申请涉及一种讽刺类型的文本识别方法、装置、设备及计算机可读介质。该方法包括:获取待处理文本,待处理文本来自于社交媒体网络平台;采用多种方式提取待处理文本的目标特征信息,目标特征信息为从特征集合中选择出来的多个特征信息的加权和表示;根据第一神经网络模型对目标特征信息的识别结果确定待处理文本的文本类型,第一神经网络模型是采用具有标记信息的训练数据对第二神经网络模型进行训练后得到的,标记信息用于标记训练数据是否为目标类型。本申请从多个维度捕获词间关联特征,并从讽刺文本的情感倾向转换出发,挖掘词语间的冲突性,进而充分体现句子中地所蕴含的讽刺含义,最终准确、合理地识别讽刺文本。
-
公开(公告)号:CN109800431B
公开(公告)日:2020-07-28
申请号:CN201910062802.8
申请日:2019-01-23
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/289 , G06F16/35
Abstract: 本发明属于计算机科学技术领域,尤其是涉及一种事件信息关键词提取、监控方法及系统及存储和处理装置,旨在为了解决解决无监督方法提取关键词效果不稳定的问题。本发明提取方法对于获取的待监控的事件信息,基于多种关键词提取技术提取并优选一组相关性很强的关键词作为第一关键词组,而后基于关键词在时域的发展演化选出最新的热点词汇作为第二关键词组,再后对同一时间段内的同一事件的不同报道进行聚类,提取各聚类的关键词合并后作为第三关键字组,最后合并三个关键词组并选定最终的关键词组合。本发明提高了系统的稳定性,同时兼顾了时域及同一事件不同侧面的发展方向。
-
公开(公告)号:CN109977227A
公开(公告)日:2019-07-05
申请号:CN201910205999.6
申请日:2019-03-19
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明属于信息分类领域,具体涉及了一种基于特征编码的文本特征提取方法、系统、装置,旨在解决文本特征提取中运算复杂度高、分类效率和精度低的问题。本发明方法包括:对获取的文本预处理,获得词候选特征序列;基于词候选特征序列,生成多个二进制编码;采用基因遗传算法筛选二进制编码,获得最优二进制编码;解码最优二进制编码获得最优词特征序列并输出。本发明将一系列候选特征转化为易处理的编码序列,并使用基因遗传算法的自动筛选功能,对特征进行最大化的全局最优挑选,能够有效地筛选出最小有效特征集。
-
公开(公告)号:CN116127964A
公开(公告)日:2023-05-16
申请号:CN202211600947.7
申请日:2022-12-13
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司 , 国家计算机网络与信息安全管理中心天津分中心
IPC: G06F40/284 , G06F40/30 , G06F16/35 , H04L9/40 , H04W12/12
Abstract: 本发明公开了一种融合传播关系的诈骗信息的检测方法。该方法包括:获取第一信息组、诈骗账号库以及正常账号库,其中第一信息组中的每一个信息包括文本信息和发信账号;根据诈骗账号库和正常账号库从第一信息组中确定第二信息组,其中第二信息组中的每一个信息的发信账号在诈骗账号库和正常账号库中都不存在;根据第二信息组得到多个目标信息组,其中每一个目标信息组中的第一发信账号与第二发信账号的相似文本信息的数量大于第一阈值;计算每一个目标信息组的诈骗权重值;在目标信息组的诈骗权重值大于第二阈值的情况下,将目标信息组中的每一个文本信息确定为诈骗信息。本发明解决了对大量诈骗信息进行检测时,处理效率低的技术问题。
-
公开(公告)号:CN115718835A
公开(公告)日:2023-02-28
申请号:CN202211370652.5
申请日:2022-11-03
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC: G06F16/9535 , G06F17/16
Abstract: 本申请涉及一种破除信息茧房问题的冷启动个性化推荐方法及装置,其中,方法包括:在目标账号的使用阶段处于冷启动阶段的情况下,确定与目标账号的用户行为相似度达到第一阈值的对照账号;利用对照账号的对照兴趣矩阵确定目标账号的目标兴趣矩阵;利用目标兴趣矩阵在预设内容池中确定候选推荐集;利用量化因子对候选推荐集中的特征相关度进行权重调整,得到各个候选推荐数据的推荐指数;将推荐指数达到第二阈值的候选推荐数据确定为目标推荐数据,并将目标推荐数据推送给目标账号。通过对照账号来预测用户账号的兴趣矩阵,然后用兴趣矩阵选出候选推荐集,最后结合目标账号的浏览记录确定推荐数据,解决了为冷启动阶段用户推荐的内容趋于同质化的问题。
-
公开(公告)号:CN115270807A
公开(公告)日:2022-11-01
申请号:CN202210764771.2
申请日:2022-06-29
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
Abstract: 本公开涉及一种网络用户的情感倾向判定方法、装置、设备及存储介质,其中方法包括:获取网络用户对目标事件评论的第一评论信息,以及对象对所述目标事件的第二评论信息;根据所述第一评论信息构建所述目标事件的知识图谱;基于所述知识图谱对所述第二评论信息进行情感分析,得到第一情感倾向值;至少基于所述第一情感倾向值,确定所述对象对于所述目标事件的情感倾向。本公开使用整体网络用户的评论构建知识图谱作为目标事件的背景知识库,通过结合目标事件的背景知识来对目标对象的网络用户的评论进行情感分析,进而判定情感倾向,使得对网络用户情感倾向的判定更准确。
-
公开(公告)号:CN113505221B
公开(公告)日:2024-03-12
申请号:CN202010214386.1
申请日:2020-03-24
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司 , 国科智安(北京)科技有限公司
IPC: G06F16/35 , G06F18/2411 , G06Q30/018
Abstract: 本发明公开了一种企业虚假宣传风险识别方法、设备和存储介质。该方法包括:在目标企业对应的多个企业舆情文本中,提取疑似风险文本;在每个疑似风险文本中提取对应种类的风险特征,形成每个疑似风险文本对应的风险特征向量;将多个疑似风险文本分别对应的风险特征向量顺次输入预先训练的风险识别模型,使风险识别模型对每个疑似风险文本进行识别,并将识别为存在虚假宣传风险的疑似风险文本确定为风险文本;根据确定出的所有风险文本的信息,确定目标企业对应的虚假宣传风险强度值;如果虚假宣传风险强度值大于预设的风险阈值,则确定目标企业存在虚假宣传风险。本发明可以避免人工匹配规则的局限性,提升了虚假宣传风险识别的准确性。
-
公开(公告)号:CN115310000A
公开(公告)日:2022-11-08
申请号:CN202110432130.2
申请日:2021-04-21
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司 , 国科智安(北京)科技有限公司
IPC: G06F16/9536 , G06F16/955 , G06Q50/00
Abstract: 本发明提供了一种信息处理方法、处理装置、电子设备和可读存储介质,方法包括:获取文本数据,根据文本数据得到目标统一资源定位符;将文本数据输入至目标业务的分类模型,得到文本数据的目标业务相关度;确定目标统一资源定位符的热度值;根据热度值和文本数据的目标业务相关度,确定目标统一资源定位符的推荐指数;根据推荐指数,输出目标统一资源定位符,通过运行该方法,可以为文本数据中的抽取得到的目标统一资源定位符标注推荐指数,并根据推荐指数输出目标统一资源定位符,以实现信源的推荐。
-
-
-
-
-
-
-
-
-