-
公开(公告)号:CN115034286A
公开(公告)日:2022-09-09
申请号:CN202210435266.3
申请日:2022-04-24
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种基于自适应损失函数的异常用户识别方法和装置,其中,该方法包括:获取web系统的用户行为日志数据样本,并将用户行为日志数据样本向量化,得到无标签数据样本和有标签数据样本;进行数据预处理得到训练数据集;基于训练数据集的输入特征训练第一自编码器模型,并基于第一自编码器模型构造无标签数据样本损失函数和有标签数据样本损失函数;迭代优化第一自编码器模型并构造异常用户检测优化问题函数,得到第二自编码器模型;基于第二自编码器模型,对无标签数据样本进行异常点检测,以识别异常用户。本发明解决实际业务场景中,无标签数据中存在异常点,采用固定损失函数难以提高准确率,误报率高的技术问题。
-
公开(公告)号:CN110879856B
公开(公告)日:2022-08-05
申请号:CN201911180128.X
申请日:2019-11-27
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F16/901 , G06F16/906 , G06F16/909 , G06K9/62 , G06Q50/00
Abstract: 本发明公开了一种基于多特征融合的社交群体分类方法及系统。本方法为:1)对一目标社交群体的数据集,对该数据集中各用户的轨迹数据进行预处理,去除噪声并对缺失位置信息进行插值;2)使用频繁序列挖掘算法从各用户轨迹数据中挖掘对应用户的轨迹模式,再将用户的轨迹模式看作时序序列,采用LSTM对该时间序列进行编码,得到用户的轨迹编码;3)根据所述社交关系生成一图网络,将所述社交关系投影到低维空间,学习得到各用户的嵌入表示;4)将每一用户的轨迹编码和对应用户的嵌入表示结合输入softmax层,确定各用户的类别,实现对该目标社交群体的分类。本发明大大提升了群体分类的精度。
-
公开(公告)号:CN112367262B
公开(公告)日:2022-07-05
申请号:CN202010844839.9
申请日:2020-08-20
Applicant: 国家计算机网络与信息安全管理中心 , 长安通信科技有限责任公司 , 北京百卓网络技术有限公司
Inventor: 党向磊 , 张良 , 胡燕林 , 李佳 , 陈训逊 , 云晓春 , 黄亮 , 刘伟 , 郭三川 , 杨云龙 , 王鼎华 , 戴光耀 , 吴昊 , 李瑞轩 , 郑展伟 , 房超 , 冀晓凯
IPC: H04L45/7453
Abstract: 一种五元组规则匹配的方法,该五元组规则模板预先进行了分类,并为分类后的规则模板设置关联规则有效标志,该方法具体包括:接收数据报文并提取五元组信息;根据提取的五元组信息依次对分类后的规则模板类型进行判断,并进一步确定该五元组信息所匹配的规则模板,记录其命中的规则模板相对应的关联规则有效标志;根据所命中的关联规则有效标志,在所确定的规则模板类型对应的规则Hash表中顺次查找相匹配的规则表项,并输出匹配结果。此外本发明实施例还提供了一种规则匹配装置。通过本发明实施例提供的方法、装置及芯片,可以显著提升五元组规则查表效率,解决了规则表资源竞争的问题。
-
公开(公告)号:CN112836493A
公开(公告)日:2021-05-25
申请号:CN202011404000.X
申请日:2020-12-04
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/226 , G06F40/284 , G06F16/33
Abstract: 本发明公开了一种转写文本校对方法及存储介质,包括,基于预先构建的校对样本库对待校对文本按照不同文本粒度进行分析校对,获得对应的候选方案集;根据所述候选方案集确定校对方案,并通过所述校对方案确定校对结果。本发明方法基于预先构建的校对样本库对待校对文本按照不同文本粒度进行分析校对,获得对应的候选方案集;根据所述候选方案集确定校对方案,由此从不同的文本粒度出发确定校对方案,提高了转写文本的准确性和语义的合理性。
-
公开(公告)号:CN110633366A
公开(公告)日:2019-12-31
申请号:CN201910697992.0
申请日:2019-07-31
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提出了一种短文本分类方法、装置和存储介质,用以从有限的训练数据中获取泛化能力强并且较为准确的分类特征,提高短文本分类的准确性。所述短文本分类方法,包括:获取待分类短文本;将所述待分类短文本输入到多层分类器中,其中,所述多层分类器为利用训练样本和所述待分类短文本所属目标领域的领域知识图谱进行训练得到的,每一层分类器提取不同的文本特征进行训练;根据所述多层分类器的输出结果,确定所述待分类短文本对应的文本类别。
-
公开(公告)号:CN119991328A
公开(公告)日:2025-05-13
申请号:CN202510151780.8
申请日:2025-02-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06Q50/00 , G06F18/20 , G06F18/22 , G06F18/2323 , G06F16/9535 , G06N5/025 , G06F123/02
Abstract: 本公开涉及复杂网络分析技术领域,具体涉及一种融合内容结构规则和时间规律的目标社区发现方法及装置,所述融合内容结构规则和时间规律的目标社区发现方法,包括:获取用户的发文信息以及发文次数;从所述发文信息中识别用户内容结构规则,并通过杰卡德相似系数计算用户间内容结构规则相似度;基于所述发文次数构建用户发文时间规律矩阵,并通过皮尔逊相关系数计算用户间时间规律相似度;建立基于用户间内容结构规则相似度以及用户间时间规律相似度的网络无向加权图;使用谱聚类方法对于网络无向加权图进行社区发现,得到社区划分结果。上述技术方案有助于发现社交平台中的隐藏社群和影响力网络,准确定位基于用户偏好的目标社区。
-
公开(公告)号:CN119988633A
公开(公告)日:2025-05-13
申请号:CN202510151779.5
申请日:2025-02-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/353 , G06F40/16 , G06F40/186 , G06F40/295 , G06F18/214 , G06F18/2415 , G06F18/2431 , G06N3/045 , G06N3/0464 , G06N5/022
Abstract: 本公开涉及自然语言处理技术领域,具体涉及一种基于大模型和知识库的文本观点自动标注方法及装置,所述基于大模型和知识库的文本观点自动标注方法包括:识别知识库中存在的与原始文本的实体对应的知识库实体以及所述知识库实体的扩展实体,将扩展实体基于预定义实体关系插入到原始文本中进行知识补全,生成知识嵌入文本;提供给定话题实体集;创建提示模板,将所述知识嵌入文本以及给定话题实体集填充所述提示模板中,然后利用大语言模型进行生成式标注得到态度标签;基于所述给定话题实体,态度标签得到倾向标签;基于所述原始文本、倾向标签构建标注数据集。上述技术方案对于高质量标注数据集的标注工作提供了有力支持。
-
公开(公告)号:CN116049483A
公开(公告)日:2023-05-02
申请号:CN202211427384.6
申请日:2022-11-15
Applicant: 国家计算机网络与信息安全管理中心 , 长安通信科技有限责任公司
IPC: G06F16/735 , G06F16/75 , G06F16/783 , G06F16/33 , G06F16/335 , G06F40/289 , G06N3/0464 , G06N3/048
Abstract: 本发明涉及短视频用户标签构建技术领域,具体公开了一种基于多模态数据的用户标签构建方法及系统,包括:S100数据预处理,采集短视频平台用户的数据并对数据进行分类,数据种类包括视频信息、平台信息和文本内容信息;S200视频标签处理,对视频信息进行分析计算,并对依据视频内容输出视频标签;S300平台信息标签处理,依据平台标签信息对用户文本信息进行处理,并输出平台信息标签,等步骤;本发明采用视频风格分类算法对用户产生的视频进行截帧过滤、统计,输出用户视频内容偏好标签,该维度比较真实的体现了用户的喜好;本发明结合了用户视频、平台采集信息、文本内容等多源数据进行标签生成,使得生成的标签结果能够更好的刻画用户的特征。
-
公开(公告)号:CN110704612B
公开(公告)日:2022-09-16
申请号:CN201910732451.7
申请日:2019-08-09
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F16/35 , G06F16/31 , G06F40/216 , G06F40/30 , G06Q50/00
Abstract: 本发明提出了一种社交群体发现方法、装置和存储介质,用以提高社交群体发现精度和准确度。所述社交群体发现方法,包括:利用预先设定的种子用户和约束条件,从通信数据源中查找候选用户,所述候选用户包括与所述种子用户通信的第一用户和/或满足所述约束条件的第二用户;从所述候选用户的通信数据中提取与所述种子用户关联的关联特征信息;根据提取的关联特征信息,确定每一候选用户对应的置信度;确定对应的置信度大于预设阈值的候选用户为目标用户;根据目标用户之间的通信联系建立初始群体网络;利用群体发现算法从所述初始群体网络中发现社交群体子网络。
-
公开(公告)号:CN114626425A
公开(公告)日:2022-06-14
申请号:CN202011456860.8
申请日:2020-12-10
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06K9/62 , G06F40/289 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种面向噪声文本的多视角交互匹配方法及电子装置,包括对两段待匹配噪声文本分别编码,得到两段编码向量序列,并向两段编码向量序列的每个编码向量中加入位置信息;对加入位置信息的两段编码向量序列进行内部交互,分别得到两段内部交互结果;对两段内部交互结果进行外部交互,分别构建两个双向的噪声文本交互矩阵;拼接两个噪声文本交互矩阵,判断两个待匹配噪声文本是否匹配。本发明采用注意力机制捕获噪声文本之间的双向匹配模式,受噪声文本中句子的逻辑顺序影响较小,增加文本有效语义单词影响,提高模型时间效率及噪声文本匹配效果,避免传递匹配问题。
-
-
-
-
-
-
-
-
-