-
公开(公告)号:CN115034286B
公开(公告)日:2024-07-02
申请号:CN202210435266.3
申请日:2022-04-24
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/24 , G06F18/214 , G06N3/0455 , G06N3/084
Abstract: 本发明公开了一种基于自适应损失函数的异常用户识别方法和装置,其中,该方法包括:获取web系统的用户行为日志数据样本,并将用户行为日志数据样本向量化,得到无标签数据样本和有标签数据样本;进行数据预处理得到训练数据集;基于训练数据集的输入特征训练第一自编码器模型,并基于第一自编码器模型构造无标签数据样本损失函数和有标签数据样本损失函数;迭代优化第一自编码器模型并构造异常用户检测优化问题函数,得到第二自编码器模型;基于第二自编码器模型,对无标签数据样本进行异常点检测,以识别异常用户。本发明解决实际业务场景中,无标签数据中存在异常点,采用固定损失函数难以提高准确率,误报率高的技术问题。
-
公开(公告)号:CN117541955A
公开(公告)日:2024-02-09
申请号:CN202311368194.6
申请日:2023-10-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06V20/40 , G06V20/62 , G06V10/764 , G06V10/80 , G06V10/82
Abstract: 本发明公开了一种基于多维度视频特征的短视频平台账号智能判定方法,属于短视频平台账号智能判定领域,具体包括:1)提取视频帧文本信息,利用差分法抽取视频中不同的关键帧,获取关键帧中的文本信息。2)视频整体特征提取,通过使用3D卷积网络端到端的获取视频的整体特征。3)融合多维度特征对视频进行判定,将视频整体特征与文本特征进行融合,通过引入Sigmoid函数输出每一类别对应的置信度,完成对视频的类别判断。4)账户类别判定,通过设计赋值加权平均的方法完成对账户多视频类别的综合判定,从而得到准确的账户类别。本发明解决了短视频平台账户人力成本的消耗,在短视频平台发展的过程中具有极大的应用价值。
-
公开(公告)号:CN112836493B
公开(公告)日:2023-03-14
申请号:CN202011404000.X
申请日:2020-12-04
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/226 , G06F40/284 , G06F16/33
Abstract: 本发明公开了一种转写文本校对方法及存储介质,包括,基于预先构建的校对样本库对待校对文本按照不同文本粒度进行分析校对,获得对应的候选方案集;根据所述候选方案集确定校对方案,并通过所述校对方案确定校对结果。本发明方法基于预先构建的校对样本库对待校对文本按照不同文本粒度进行分析校对,获得对应的候选方案集;根据所述候选方案集确定校对方案,由此从不同的文本粒度出发确定校对方案,提高了转写文本的准确性和语义的合理性。
-
公开(公告)号:CN114330307A
公开(公告)日:2022-04-12
申请号:CN202110483554.1
申请日:2021-04-30
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/242 , G06F40/284 , G06F40/295
Abstract: 本发明公开了一种基于限定领域的分词方法及系统,方法包括:对限定领域的数据进行预处理,对预处理后得到的数据中的命名实体进行识别,并抽取出数据中的实体词汇,得到命名实体识别结果;基于预处理后得到的数据计算限定领域语料中的特征信息,并根据得到的特征信息构建新词发现模型,利用新词发现模型对语料库中的新词进行识别,以获取新词数据组;利用所述命名实体识别结果及常用词词典对获取的新词数据组进行过滤,排除掉常用词汇和实体词汇,以获取并确认敏感词,并基于确认后的敏感词建立敏感词库;结合敏感词库中获取的敏感词信息和命名实体识别结果进行分词。解决了现有技术中在限定领域中分词准确性较差的技术问题。
-
公开(公告)号:CN113094715A
公开(公告)日:2021-07-09
申请号:CN202110421626.X
申请日:2021-04-20
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提供了一种基于知识图谱的网络安全动态预警系统,预警系统包括采集装置、校准装置、核验装置、处理装置、预警装置和处理器,采集装置对知识图谱的元素进行安全网络的搭建;校准装置基于采集装置搭建的安全网络,并对各个组件的元素进行操作数地址的校准;核验装置对安全网络进行模拟核验;处理装置对采集装置、校准装置和核验装置的数据进行处理;预警装置从防护设备或路由设备的安全应用接收接入公共网络的请求,基于所接收的请求参数和针对无线网络的安全策略,向防护设备或路由设备的安全应用发送安全动作。通过校验机构还对用户指令的步长进行核验并带入异常值评估函数中,并基于不同的异常值进行监控,提升系统的防护能力。
-
公开(公告)号:CN111143508A
公开(公告)日:2020-05-12
申请号:CN201911244928.3
申请日:2019-12-06
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F16/33 , G06F40/30 , G06F40/289 , G06K9/62
Abstract: 本发明提出了一种基于通信类短文本的事件检测与跟踪方法,包括:提取与某事件对应的样本集合中各通信类短文本的语义特征、关键要素,及该样本集合的传播网络;根据该语义特征、该关键要素和该传播网络,分别获得任意两个该通信类短文本之间的语义距离、要素距离和用户距离;以该语义距离、该要素距离和该用户距离,获得任意两个该通信类短文本之间的度量距离;对所有该度量距离进行聚类,获得该事件的事件检测结果;提取该事件检测结果的特征属性以跟踪该事件。还提出一种基于通信类短文本的事件检测与跟踪系统,以及一种进行基于通信类短文本的事件检测与跟踪的数据处理装置。
-
公开(公告)号:CN110825998A
公开(公告)日:2020-02-21
申请号:CN201910733928.3
申请日:2019-08-09
Applicant: 国家计算机网络与信息安全管理中心 , 哈尔滨工业大学软件工程股份有限公司
IPC: G06F16/958 , G06F16/35 , G06K9/62
Abstract: 本发明公开了一种网站识别方法及可读存储介质,该方法包括如下步骤:提取网站样本数据,并对所述网站样本数据进行处理构建网页文本卷积神经网络CNN特征;提取网页特征,根据所述网页特征和所述网页文本CNN特征进行特征融合获得网站融合特征;根据所述网站融合特征进行模型训练获得识别模型,根据所述识别模型对待识别的网站进行识别。本发明方法通过使用网页文本特征构建的分类模型比较构建多特征融合分类模型,分类精度有大幅度提高。
-
公开(公告)号:CN110674290A
公开(公告)日:2020-01-10
申请号:CN201910733074.9
申请日:2019-08-09
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/36 , G06F40/284 , G06Q50/00
Abstract: 本发明提出了一种用于重叠社区发现的关系预测方法、装置和存储介质,用以解决由于获取的用户关系图不够完整,降低了社区发现结果准确性的问题。用于重叠社区发现的关系预测方法,包括:获取用户通信信息中包含的信息内容并分类;确定每一类信息内容中包含的两两信息内容之间的相似度;对于相似度大于预设阈值的两条信息内容,构建该两条信息内容的发送信息用户之间的短时转发关系;构建所述用户通信信息中发送信息用户和接收信息用户之间的收发关系;根据所述短时转发关系和所述收发关系,构建用户关系图;基于所述用户关系图,利用社区发现算法进行社区发现。
-
公开(公告)号:CN119760081A
公开(公告)日:2025-04-04
申请号:CN202411871416.0
申请日:2024-12-18
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/3329 , G06F16/334 , G06F40/242 , G06F40/30 , G16H20/70
Abstract: 一种融合多源知识的情感支持对话回复生成模型及方法,属于自然语言处理领域,包括:结合常识知识补充用户外在处境认知知识,结合心理健康对话样例知识补充用户内在情感状态认知知识;面向多源认知知识与情感支持回复策略的相互约束建模;基于编码上下文与常识知识建模每个对话回合级的细粒度过渡信息;通过修改预训练语言模型Blenderbot解码器,将上下文隐藏状态分别与多因素进行交叉注意力计算,生成最终的情感支持回复。本发明联合提高了模型的知识选择能力、策略预测能力与情感认知能力,实现了细粒度的情感理解,辅助对话模型深入理解用户外在处境与内在情感状态,填补情感支持对话模型在情感认知能力上的缺失。
-
公开(公告)号:CN119739851A
公开(公告)日:2025-04-01
申请号:CN202411872070.6
申请日:2024-12-18
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/335 , G06F40/247 , G06F40/279 , G06F40/30 , G06F18/214 , G06N3/08 , G06Q30/0241
Abstract: 本发明涉及广告检测技术领域,特别是一种基于大模型数据增强和深度学习的广告检测方法,采用分层抽样策略,对初始标注数据进行抽样,基于抽样数据集微调大模型,提升其在广告文本上的分类能力。利用筛选规则筛选具有明显语义特征的广告文本数据,利用微调后的大模型的语义理解能力对满足条件的广告文本数据进行预标注,再进行人工校对,以确保数据的准确性和一致性。利用人工校对后的数据进行BERT模型的训练,通过对大规模数据进行分类和识别,显著提高广告检测的效果和应用价值。
-
-
-
-
-
-
-
-
-