-
公开(公告)号:CN116611433A
公开(公告)日:2023-08-18
申请号:CN202310478295.2
申请日:2023-04-28
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/289 , G06Q10/0639 , G06F18/24 , G06N3/0464 , G06N20/00
Abstract: 本发明实施例涉及一种情感识别方法及系统,所述方法包括:获取目标文本对应的初始数据,所述初始数据是由所述目标文本经过预处理得到的;设定所述初始数据的细粒度规则,得到所述初始数据对应不同长度的类别文本;根据所述细粒度规则和所述类别文本,确定不同长度的所述类别文本对应的不同类别的情感识别模型;将所述类别文本输入到对应的所述情感识别模型中进行识别处理,得到所述目标文本的情感识别结果。通过对获得到初始数据按照设定的细粒度规则进行设定分类,确定情感识别模型,通过识别处理得到情感识别结果,由此,可以更加准确地表达和识别用户的情感倾向和理解用户情感,更好地支持情感分析应用,更好地支持舆情分析,实现对短文本的情感识别处理的技术效果。
-
公开(公告)号:CN119885253A
公开(公告)日:2025-04-25
申请号:CN202411818233.2
申请日:2024-12-11
Applicant: 国家计算机网络与信息安全管理中心 , 北京邮电大学
IPC: G06F21/62 , G06F21/60 , G06F18/241 , G06F18/20 , G06N3/08
Abstract: 本申请提供一种数据分类方法、装置、设备及存储介质,该方法包括:获取待处理数据;将所述待处理数据输入数据分类模型中,得到分类数据和所述分类数据的类别;所述数据分类模型为深度学习模型;根据所述分类数据的类别,基于自然语言处理技术和预设识别规则处理所述分类数据,确定敏感信息。本申请实现了对数据的精确分类,并能够识别和处理敏感信息,增强了数据安全性。
-
公开(公告)号:CN119884071A
公开(公告)日:2025-04-25
申请号:CN202411818236.6
申请日:2024-12-11
Applicant: 国家计算机网络与信息安全管理中心 , 北京邮电大学
Abstract: 本申请提供一种用于在分布式环境中管理数据库的方法及相关设备。该方法包括:执行数据库实例的探测任务,以探测到目标数据库实例,获取所述目标数据库实例的物理存储位置和配置信息,基于所述物理存储位置和配置信息,获取所述目标数据库实例对应的数据库的第一特征信息,获取预设的数据库中的第二特征信息,确定所述第一特征信息与所述第二特征信息是否匹配,响应于所述第一特征信息和所述第二特征信息匹配,获取所述数据库的类型和版本,以管理所述数据库。通过上述方法能够在分布式的复杂环境中,自动化地识别和定位数据库实例及其存储位置,减少人工干预,提高数据库探测的效率与准确性。
-
公开(公告)号:CN119598054A
公开(公告)日:2025-03-11
申请号:CN202510143768.2
申请日:2025-02-10
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/958 , G06V30/19
Abstract: 本发明涉及人工智能技术领域,提供一种网站类型识别方法、装置、电子设备和存储介质,其中方法包括:获取待识别网站的网址,并基于所述待识别网站的网址,获取所述待识别网站内所有的待分类图像;基于特征提取模型,对各待分类图像进行特征提取,得到所述各待分类图像的图像特征;基于文本特征库中的各文本特征和所述各待分类图像的图像特征,确定所述各待分类图像的类别;基于所述各待分类图像的类别,确定所述待识别网站的类型。本发明通过结合图像特征和文本特征,实现了基于图像和文本描述的多模态特征的检索式分类判断,可以有效提高网站类型识别的准确率。
-
公开(公告)号:CN118520929B
公开(公告)日:2024-10-29
申请号:CN202411003497.2
申请日:2024-07-25
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06N3/09 , G06N3/0455 , G06F40/194
Abstract: 本发明提供一种文本相似度确定模型的训练方法及文本相似度计算方法,属于计算机技术领域,该训练方法包括:获取第一数据集和第二数据集;第一数据集中包括至少一个短文本数据对;第二数据集中包括至少一个目标文本数据对,目标文本数据对中的两个目标文本数据至少一个为长文本数据;基于句向量对比模型,获取第二数据集中各目标文本数据的关键表述;句向量对比模型是基于第一数据集和第一损失函数对第一预训练模型训练得到的;基于各关键表述和第二损失函数,对第二预训练模型进行训练,得到文本相似性确定模型。通过在判定过程中引入短文本和长文本,提升了文本相似度确定模型输出结果的准确性。
-
公开(公告)号:CN116992128A
公开(公告)日:2023-11-03
申请号:CN202310761657.9
申请日:2023-06-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F18/24 , G06Q10/0639
Abstract: 本申请公开了一种检测推荐系统的推荐结果多样性的方法及设备,包括:获取所述推荐系统的推荐结果,并基于预设主题分类模型对所述推荐结果进行分类,以获得推荐内容的主题类别;确定推荐内容的主题类别中,相似的主题内容,通过预设情感立场检测模型进行情感立场检测;根据情感立场检测结果,计算考虑情感立场多样性的多样性评价指标。本申请的方法将情感立场维度的多样性融入到推荐系统多样性指标中,由此提出了一种考虑了情感立场多样性的推荐系统多样性检测方法。
-
公开(公告)号:CN116881550A
公开(公告)日:2023-10-13
申请号:CN202310764113.8
申请日:2023-06-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F18/23213 , G06F9/445 , G06F21/56 , G06N3/04 , G06N3/08
Abstract: 本申请公开了一种内容推荐系统冷启动安全风险检测方法及装置,包括:对被测推荐系统,根据所述被测推荐系统的注册规则,生成用户画像,并根据生成的用户画像、在本地系统构建相应的用户;为任一用户,基于配置的交互策略,在所述本地系统执行交互;根据交互结果构建训练数据;将训练数据输入潜在特征学习模型,执行训练;对所述待检测的内容数据,输入训练好的潜在特征学习模型;统计并逆向排序所述潜在特征学习模型的输出结果的重构误差;取排序后前指定数量的输出数据作为异常数据、进行聚类;根据聚类结果,判断内容推荐系统冷启动是否存在安全风险。本申请的方法能够用于判别被测推荐系统在冷启动阶段是否被恶意操纵。
-
公开(公告)号:CN116595316A
公开(公告)日:2023-08-15
申请号:CN202310430301.7
申请日:2023-04-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/10 , G06F18/22 , G06F18/214 , G06F16/9035 , G06F16/951 , G06F16/9537 , G06F16/9538 , G06F16/9535 , G06F16/9038
Abstract: 本发明提出了一种基于评分卡模型的多平台虚假信息识别方法及装置,方法包括:获取各自表征一主题的多组数据信息;基于数据信息与预先标记的数据信息的比对情况进行筛选;对当前数据信息进行排序以及填充处理;利用当前数据信息,构建评分卡模型,并确认每一主题对应的数据信息中,各个维度信息对数据信息危险程度的影响情况;利用当前构建的评分卡模型,对再次获取的表征一主题的数据信息进行识别处理。本发明应用评分卡模型,可基于同一主题的虚假信息识别,并且可以根据影响主题信息的多种因素,在不同的周期内,识别不同维度数据的影响因素权重。
-
公开(公告)号:CN115718835A
公开(公告)日:2023-02-28
申请号:CN202211370652.5
申请日:2022-11-03
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC: G06F16/9535 , G06F17/16
Abstract: 本申请涉及一种破除信息茧房问题的冷启动个性化推荐方法及装置,其中,方法包括:在目标账号的使用阶段处于冷启动阶段的情况下,确定与目标账号的用户行为相似度达到第一阈值的对照账号;利用对照账号的对照兴趣矩阵确定目标账号的目标兴趣矩阵;利用目标兴趣矩阵在预设内容池中确定候选推荐集;利用量化因子对候选推荐集中的特征相关度进行权重调整,得到各个候选推荐数据的推荐指数;将推荐指数达到第二阈值的候选推荐数据确定为目标推荐数据,并将目标推荐数据推送给目标账号。通过对照账号来预测用户账号的兴趣矩阵,然后用兴趣矩阵选出候选推荐集,最后结合目标账号的浏览记录确定推荐数据,解决了为冷启动阶段用户推荐的内容趋于同质化的问题。
-
公开(公告)号:CN115034286A
公开(公告)日:2022-09-09
申请号:CN202210435266.3
申请日:2022-04-24
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种基于自适应损失函数的异常用户识别方法和装置,其中,该方法包括:获取web系统的用户行为日志数据样本,并将用户行为日志数据样本向量化,得到无标签数据样本和有标签数据样本;进行数据预处理得到训练数据集;基于训练数据集的输入特征训练第一自编码器模型,并基于第一自编码器模型构造无标签数据样本损失函数和有标签数据样本损失函数;迭代优化第一自编码器模型并构造异常用户检测优化问题函数,得到第二自编码器模型;基于第二自编码器模型,对无标签数据样本进行异常点检测,以识别异常用户。本发明解决实际业务场景中,无标签数据中存在异常点,采用固定损失函数难以提高准确率,误报率高的技术问题。
-
-
-
-
-
-
-
-
-