-
公开(公告)号:CN116992128A
公开(公告)日:2023-11-03
申请号:CN202310761657.9
申请日:2023-06-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F18/24 , G06Q10/0639
Abstract: 本申请公开了一种检测推荐系统的推荐结果多样性的方法及设备,包括:获取所述推荐系统的推荐结果,并基于预设主题分类模型对所述推荐结果进行分类,以获得推荐内容的主题类别;确定推荐内容的主题类别中,相似的主题内容,通过预设情感立场检测模型进行情感立场检测;根据情感立场检测结果,计算考虑情感立场多样性的多样性评价指标。本申请的方法将情感立场维度的多样性融入到推荐系统多样性指标中,由此提出了一种考虑了情感立场多样性的推荐系统多样性检测方法。
-
公开(公告)号:CN116881550A
公开(公告)日:2023-10-13
申请号:CN202310764113.8
申请日:2023-06-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F18/23213 , G06F9/445 , G06F21/56 , G06N3/04 , G06N3/08
Abstract: 本申请公开了一种内容推荐系统冷启动安全风险检测方法及装置,包括:对被测推荐系统,根据所述被测推荐系统的注册规则,生成用户画像,并根据生成的用户画像、在本地系统构建相应的用户;为任一用户,基于配置的交互策略,在所述本地系统执行交互;根据交互结果构建训练数据;将训练数据输入潜在特征学习模型,执行训练;对所述待检测的内容数据,输入训练好的潜在特征学习模型;统计并逆向排序所述潜在特征学习模型的输出结果的重构误差;取排序后前指定数量的输出数据作为异常数据、进行聚类;根据聚类结果,判断内容推荐系统冷启动是否存在安全风险。本申请的方法能够用于判别被测推荐系统在冷启动阶段是否被恶意操纵。
-
公开(公告)号:CN116595316A
公开(公告)日:2023-08-15
申请号:CN202310430301.7
申请日:2023-04-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/10 , G06F18/22 , G06F18/214 , G06F16/9035 , G06F16/951 , G06F16/9537 , G06F16/9538 , G06F16/9535 , G06F16/9038
Abstract: 本发明提出了一种基于评分卡模型的多平台虚假信息识别方法及装置,方法包括:获取各自表征一主题的多组数据信息;基于数据信息与预先标记的数据信息的比对情况进行筛选;对当前数据信息进行排序以及填充处理;利用当前数据信息,构建评分卡模型,并确认每一主题对应的数据信息中,各个维度信息对数据信息危险程度的影响情况;利用当前构建的评分卡模型,对再次获取的表征一主题的数据信息进行识别处理。本发明应用评分卡模型,可基于同一主题的虚假信息识别,并且可以根据影响主题信息的多种因素,在不同的周期内,识别不同维度数据的影响因素权重。
-
公开(公告)号:CN115309899B
公开(公告)日:2023-05-16
申请号:CN202210949186.X
申请日:2022-08-09
Applicant: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F18/22 , G06F40/284 , G06N3/0455
Abstract: 本发明公开了一种文本中特定内容识别存储方法及系统,属于文特定词识别的技术领域,其方法包括生成特定词库和规则库;获取待识别的文本集合;提取当前特定文本数据集中的新特定词,得到新特定词集合;将需要训练的词组输入BERT模型;从特定文本中获取疑似新特定词集合,利用BERT模型计算特定词库中各词的特征向量与疑似新特定词集合中各词的特征向量的余弦相似度,并基于计算结果判定新特定词。本发明解决了现有技术中基于预构建模式规则的匹配方式仅局限于特定匹配规则模式,匹配方式不够灵活,结果不够全面,难以及时识别海量新出现的特定词及其变体词,且由于文本中涉及大量错综复杂的词语,容易造成特定词的模糊匹配,导致误识别的问题。
-
公开(公告)号:CN115718835A
公开(公告)日:2023-02-28
申请号:CN202211370652.5
申请日:2022-11-03
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC: G06F16/9535 , G06F17/16
Abstract: 本申请涉及一种破除信息茧房问题的冷启动个性化推荐方法及装置,其中,方法包括:在目标账号的使用阶段处于冷启动阶段的情况下,确定与目标账号的用户行为相似度达到第一阈值的对照账号;利用对照账号的对照兴趣矩阵确定目标账号的目标兴趣矩阵;利用目标兴趣矩阵在预设内容池中确定候选推荐集;利用量化因子对候选推荐集中的特征相关度进行权重调整,得到各个候选推荐数据的推荐指数;将推荐指数达到第二阈值的候选推荐数据确定为目标推荐数据,并将目标推荐数据推送给目标账号。通过对照账号来预测用户账号的兴趣矩阵,然后用兴趣矩阵选出候选推荐集,最后结合目标账号的浏览记录确定推荐数据,解决了为冷启动阶段用户推荐的内容趋于同质化的问题。
-
公开(公告)号:CN114840854A
公开(公告)日:2022-08-02
申请号:CN202210380431.X
申请日:2022-04-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F21/57
Abstract: 本发明公开了一种APP典型业务流程信息服务安全风险点的识别方法及装置,包括:对APP功能点进行逻辑拆分,以在逻辑拆分后获取该APP的功能逻辑、内容逻辑、构造逻辑和运行逻辑;确定该APP的功能逻辑、内容逻辑、运行逻辑以及构造逻辑相互之间的关系,以生成该APP的典型业务流程;基于该APP的典型业务流程,根据预设的风险点匹配规则判定信息服务安全风险点。本申请的方法对APP功能点进行逻辑拆分,并确定出拆分后的逻辑之间的关系,从而确定APP的典型业务流程,以实现识别信息服务安全风险点,本申请的方法的结果客观,且适用性强。
-
公开(公告)号:CN113343219A
公开(公告)日:2021-09-03
申请号:CN202110606530.0
申请日:2021-05-31
Applicant: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种自动高效的高风险移动应用程序检测方法,包括S1、获取待测App的SDK列表和权限列表,转化为向量形式,得到列表向量;计算待测App与已知的高风险App之间的相似度,判定为潜在风险App;S2、动态分析进一步判定是否为高风险App,若判定为“是”,将其标记为高风险App;S3、人工审核判定是否是高风险App,若“是”,添加至高风险App库,标记为高风险App。本发明采用以静态分析、动态分析为主,辅助以人工审核的方式,避免了人工审核存在的效率低、成本高、准确率低等问题,实现了高风险App得自动高效识别。
-
公开(公告)号:CN112836493A
公开(公告)日:2021-05-25
申请号:CN202011404000.X
申请日:2020-12-04
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/226 , G06F40/284 , G06F16/33
Abstract: 本发明公开了一种转写文本校对方法及存储介质,包括,基于预先构建的校对样本库对待校对文本按照不同文本粒度进行分析校对,获得对应的候选方案集;根据所述候选方案集确定校对方案,并通过所述校对方案确定校对结果。本发明方法基于预先构建的校对样本库对待校对文本按照不同文本粒度进行分析校对,获得对应的候选方案集;根据所述候选方案集确定校对方案,由此从不同的文本粒度出发确定校对方案,提高了转写文本的准确性和语义的合理性。
-
公开(公告)号:CN112632597A
公开(公告)日:2021-04-09
申请号:CN202011420230.5
申请日:2020-12-08
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种数据脱敏方法、装置可读存储介质,其中方法包括:根据获取的用户提交的数据文件通过预先训练的标注模型对所述数据文件中的敏感数据进行标注,以获得标注文件;利用预设评测规则对与所述标注文件的文件类型相匹配的脱敏算法进行评测;根据用户从评测结果中选取的脱敏算法完成对所述标注文件的脱敏。本发明利用预设评测规则对与标注文件的文件类型相匹配的脱敏算法进行评测;根据用户从评测结果中选取的脱敏算法完成对标注文件的脱敏,由此可以通过规则评测和用户选择确定对应的脱敏算法,具有广泛的适用性。
-
公开(公告)号:CN110134947B
公开(公告)日:2021-03-26
申请号:CN201910307654.1
申请日:2019-04-17
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明提出一种基于不平衡多源数据的情感分类方法,包括:获取来自多个数据源的训练数据,其中训练数据包含多条文本数据,每条文本数据具有情感类型标签和其对应的数据源;按数据源对训练数据进行分类,以集合每个数据源对应的文本数据作为第一数据集,根据每个第一数据集中各情感类型标签的数量,统计每个第一数据集中情感类型的标准差,选择标准差最小的第一数据作为预训练集,其余第一数据集作为后续训练集;以预训练集训练神经网络模型的权值直到损失函数收敛,输出神经网络模型作为预分类模型,以后续训练集继续训练预分类模型直到损失函数收敛,输出预分类模型作为最终分类模型;将待情感分类文本数据输入最终分类模型,得到其情感类型。
-
-
-
-
-
-
-
-
-