-
公开(公告)号:CN116644229A
公开(公告)日:2023-08-25
申请号:CN202310545163.7
申请日:2023-05-15
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F18/214 , G06F18/243
Abstract: 本申请涉及一种推荐信息过度泛娱乐化预测方法、装置及服务器,方法应用于服务器,包括:获取用户个性化推荐场景下的待预测时刻的实时行为数据和第一历史行为数据;对待预测时刻的实时行为数据和第一历史行为数据进行特征提取,获得待输入特征;将待输入特征输入推荐信息过度泛娱乐化预测模型;获取推荐信息过度泛娱乐化预测模型的输出结果,输出结果表征用户待预测时刻是否发生推荐信息过度泛娱乐化。通过上述方式,解决了现在对过度泛娱乐化的信息推荐的预测角度的研究还存在空白的问题。
-
公开(公告)号:CN116611433A
公开(公告)日:2023-08-18
申请号:CN202310478295.2
申请日:2023-04-28
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/289 , G06Q10/0639 , G06F18/24 , G06N3/0464 , G06N20/00
Abstract: 本发明实施例涉及一种情感识别方法及系统,所述方法包括:获取目标文本对应的初始数据,所述初始数据是由所述目标文本经过预处理得到的;设定所述初始数据的细粒度规则,得到所述初始数据对应不同长度的类别文本;根据所述细粒度规则和所述类别文本,确定不同长度的所述类别文本对应的不同类别的情感识别模型;将所述类别文本输入到对应的所述情感识别模型中进行识别处理,得到所述目标文本的情感识别结果。通过对获得到初始数据按照设定的细粒度规则进行设定分类,确定情感识别模型,通过识别处理得到情感识别结果,由此,可以更加准确地表达和识别用户的情感倾向和理解用户情感,更好地支持情感分析应用,更好地支持舆情分析,实现对短文本的情感识别处理的技术效果。
-
公开(公告)号:CN116578942A
公开(公告)日:2023-08-11
申请号:CN202310853781.8
申请日:2023-07-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/2433 , G06F17/18 , G06F18/214 , G06Q10/10
Abstract: 本申请实施例涉及一种榜单异常的处理方法及装置,所述方法包括:获取目标榜单信息,并按照设定的检测方法对目标榜单信息进行异常检测,得到对应的异常检测结果;将异常检测结果对应的异常样本信息输入到预先训练好的预估模型中进行评估处理,输出异常样本信息对应的在榜时长;根据在榜时长确定反馈调节策略;基于反馈调节策略执行对异常在榜信息的处理。通过创建榜单异常的检测工具,检测出每个榜单信息中存在的异常样本信息,通过设定的反馈调节策略对异常样本信息进行处理,达到治理异常榜单信息的目的;由此,可以实现利用机器审核结合人工审核,形成一套实时报警、反馈、调节的热榜治理机制,维护热榜的公平和稳定的技术效果。
-
公开(公告)号:CN115269834A
公开(公告)日:2022-11-01
申请号:CN202210782688.8
申请日:2022-06-28
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于BERT的高精度文本分类方法及装置,在输入端采用FastText模型,对词汇进行嵌入表示得到表示向量,然后把表示向量作为BERT模型的输入,将BERT的输出结果接上全连接层+softmax,实现文本分类。本发明提前用FastText模型处理语料数据,获取字符的特征,解决了OOV的embedding问题,同时获取词的形态变换,对富有词型变换的语料具有更好的表示能力;使用BERT能够提前预训练大量的语料,增加了词向量的语义丰富度,获得更好的上下文表示;在BERT模型的输出添加全连接层和softmax进行文本分类,提高了文本分类的精度。
-
公开(公告)号:CN115190217A
公开(公告)日:2022-10-14
申请号:CN202210801788.0
申请日:2022-07-07
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种融合自编码网络的数据安全加密方法和装置,涉及互联网数据处理技术领域。本发明为了解决现有数据安全加密时面对包含大量图片的海量数据存储资源开销大、数据传输不安全、数据传输效率低的缺陷,其方法为采用文本加密模块对文本类型数据作加密处理,构建图片自编码网络模型,采用图片压缩模块对待加密的原始图片类型数据作预压缩处理;采用图片加密模块对图片压缩编码作加密处理,采用解密模块对需要应用于下游任务的文本密文数据或图片密文数据进行解密,采用图片重建模块对解密后的图片压缩编码进行重建复原,译码器将码字通过重建处理后得到重建图片类型数据。本发明主要用于海量数据传输。
-
公开(公告)号:CN114978585A
公开(公告)日:2022-08-30
申请号:CN202210380490.7
申请日:2022-04-12
Applicant: 国家计算机网络与信息安全管理中心 , 北京赋乐科技有限公司
Abstract: 本公开的实施例提供了基于流量特征的深度学习对称加密协议识别方法、装置、设备和计算机可读存储介质。所述方法包括获取网络流量数据;对所述网络流量数据进行预处理,得到对称加密流量;基于主成分分析‑皮尔森系数法流量识别模型和基于注意力机制的CNN‑LSTM算法流量识别模型,构建基于流量特征的对称加密协议识别模型;将所述对称加密流量,输入至所述基于流量特征的对称加密协议识别模型,完成对所述网络流量数据的识别。以此方式,实现了对对称加密协议的高效识别。
-
公开(公告)号:CN110704186B
公开(公告)日:2022-05-24
申请号:CN201910908595.3
申请日:2019-09-25
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提出了一种基于混合计算资源的分布式计算系统,用以合理分配资源,满足计算任务多样性的需求,所述系统包括计算引擎层和资源调度层,其中:所述计算引擎层由多个构建在同一个Spark计算引擎上的深度学习框架组成,针对所述计算引擎层统一封装各个深度学习框架的访问接口;所述资源调度层包括多种异构计算资源,所述异构计算资源包括以下至少一项:CPU、GPU和FPGA;在所述资源调度层,根据待处理任务的任务类型划分不同的任务队列,根据不同物理机搭载的计算资源类型划分不同的逻辑集群,根据待处理任务的任务类,将任务队列中的任务分配到对应的逻辑集群中执行。
-
公开(公告)号:CN112258377A
公开(公告)日:2021-01-22
申请号:CN202011088661.6
申请日:2020-10-13
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种鲁棒二值神经网络的构建方法及设备。鲁棒二值神经网络的构建方法,包括:对训练数据进行二值化处理;基于二值化处理后的训练数据,对预设二值神经网络进行训练;对完成训练的预设二值神经网络进行纠错编码。采用本发明,通过对训练数据进行二值化处理,可以将内存占用降低为原有的浮点型权值的1/32;同时,对训练好的二值神经网络进行纠错编码,使得编码后二元神经网络具有抵抗檫除或者错误的噪音干扰,所以编码后的二元神经网络具有很好的鲁棒性。
-
公开(公告)号:CN111159990A
公开(公告)日:2020-05-15
申请号:CN201911244936.8
申请日:2019-12-06
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F40/186 , G06F40/126 , G06F40/284 , G06F16/33 , G06F16/31
Abstract: 本发明提出一种基于模式拓展的通用特殊词识别方法及系统,提出了一种基于基础词的音形编码,常用汉字音节,常用汉字结构以及特殊字符映射节点来构建前缀树,通过比较字符编码相似度进行模糊匹配,完成新词提取的方法及系统。本发明可以应用于大量文本中特定词的发现提取,某些任务的数据集的提取生成,给定文本数据集的预处理等场景中,比如短信、微博等数据集的筛选以及纠正等文本预处理过程。本发明为下一步的文本分类任务提供了数据来源和基本标注,也对文本数据中新词的发现和纠正提供了帮助。
-
公开(公告)号:CN111078876A
公开(公告)日:2020-04-28
申请号:CN201911229492.0
申请日:2019-12-04
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F16/35
Abstract: 本发明提出了一种基于多模型集成的短文本分类方法,包括:选取多个对短文本进行分类的分类模型;对训练样本进行采样,生成与该分类模型一一对应的训练集;通过对应的训练集对该分类模型进行训练,以获得对应的最终模型;通过所有该最终模型对目标文本进行分类,获取多个分类结果向量;集成所有该分类结果向量以得到最终结果向量,以该最终结果向量中具有最大值的元素所代表的类别,作为该目标文本的类别。
-
-
-
-
-
-
-
-
-