-
公开(公告)号:CN111858925A
公开(公告)日:2020-10-30
申请号:CN202010501138.5
申请日:2020-06-04
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/335 , G06F40/211 , G06F40/289 , G06Q30/00 , G06Q50/32
Abstract: 本发明公开了电信网络诈骗事件的剧本提取方法、装置、电子设备以及存储介质。该方法包括:获取已知主题类别的电信网络诈骗事件文本;对文本进行分句操作;提取文本中各单句的关键词;利用预先建立的BERT模型提取已知主题类别的电信网络诈骗事件文本中各单句的关键词向量;基于任意两个具有相邻句序的单句的关键词向量的均值向量之间的空间距离,对两个具有相邻句序的单句进行剧情阶段的划分;获取各阶段所包含的单句的关键词作为所属的主题类别下电信网络诈骗事件中各阶段的情节特征的表示。本发明实现了对于电信网络诈骗事件剧情阶段的划分,提取出有助于识别电信网络诈骗事件的特征,从而达到精准提取电信网络诈骗事件剧本的目的。
-
公开(公告)号:CN111625661A
公开(公告)日:2020-09-04
申请号:CN202010408234.5
申请日:2020-05-14
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/45 , G06F16/483 , H04N21/845 , G06N3/04 , G06N3/08
Abstract: 本发明实施例公开了一种音视频片段分类方法及装置,所述方法包括:基于待分类音视频片段的视频帧序列提取目标视频帧,基于待分类音视频片段的音频帧序列提取目标音频帧;基于目标视频帧/目标音频帧的第一出现时刻/第二出现时刻及预设子片段时长确定第一音视频子片段/第二音视频子片段;基于第一音视频子片段/第二音视频子片段提取第一视频分量特征和第一音频分量特征/第二视频分量特征和第二音频分量特征;通过预设音视频分类模型基于第一视频分量特征、第一音频分量特征、第二视频分量特征和第二音频分量特征确定待分类音视频片段的音视频分类结果。采用本发明可以提高音视频分类效率,提高音视频分类的鲁棒性和准确率。
-
公开(公告)号:CN119863846A
公开(公告)日:2025-04-22
申请号:CN202411792800.1
申请日:2024-12-07
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提供了一种人脸匿名化方法,包括:筛选从视图数据中检出的人脸图像;从所述人脸图像中获取关键点的特征向量和高维嵌入的表征向量;构造与所述表征向量同维度的随机向量,将所述表征向量结合所述随机向量和为所述随机向量设定的噪声系数,计算扰动表征向量;将所述扰动表征向量和所述特征向量拼接后获得随机扰动后的人脸图像,以所述随机扰动后的人脸图像替换所述人脸图像。本发明有益效果:通过对人脸属性特征的的修改,不改变人脸基本状态的情况下就可以隐藏特定个人的属性特征信息,同时不会影响视觉效果。
-
公开(公告)号:CN119741919A
公开(公告)日:2025-04-01
申请号:CN202411802628.3
申请日:2024-12-09
Applicant: 国家计算机网络与信息安全管理中心
IPC: G10L15/22 , G10L13/02 , G10L21/007 , G06F40/151 , G10L25/30
Abstract: 本发明提供了一种语音匿名化方法,包括:将语音数据按照激活检测结果分割为语音数据片段,转写所述语音数据片段为文本序列;由敏感词列表和所述文本序列对比以获取敏感词,以敏感词替换符替换所述敏感词,生成脱敏文本片段;根据所述脱敏文本片段生成文本嵌入表征码,与随机声纹嵌入表征码拼接,生成拼接表征码;通过后向解码网络将所述拼接表征码解码为时频谱后,声码器将所述时频谱转化为音频波形。本发明有益效果:通过对语音声纹的修改和敏感词的提出,实现的在不改变语音数据属性的条件下,对语音数据脱敏和匿名化。
-
公开(公告)号:CN118332103A
公开(公告)日:2024-07-12
申请号:CN202410507046.6
申请日:2024-04-25
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/34 , G06F16/35 , G06F16/33 , G06F16/332 , G06F40/30 , G06F40/284 , G06N3/0455 , G06N3/047 , G06N3/084
Abstract: 本公开提供一种主题提取方法、装置、相关设备和计算机程序产品,涉及计算机与互联网技术领域。主题提取方法包括:获取多个文本和多个热点关键词,热点关键词是从网络中获得的;根据多个热点关键词对各个文本分别进行关键词匹配,以确定各个文本中的文本关键词;通过文本关键词对多个文本进行文本聚类,以确定至少一个文本组;将每个文本组中命中热点关键词最多的文本作为文本组的主题。本公开实施例可以快速且准确的从多个文本中提取出主题信息。
-
公开(公告)号:CN116775943A
公开(公告)日:2023-09-19
申请号:CN202310498578.3
申请日:2023-05-06
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/901 , G06F16/906 , G06F18/25 , G06N3/088
Abstract: 本发明公开了一种基于图挖掘的电信异常检测方法。克服了现有技术在进行电信异常检测时检测效率低和检测不够精准等问题。检测方法对通联记录数据处理后组织成图,将图由全图划分成一系列子图,进行图表征的局部学习和全局学习,获得节点级别的本地表征和子图级别的全局表征,通过异常检测算法得到每个子图的异常得分,选取异常得分最高的部分子图,通过异常检测算法得到这些子图中每个节点的异常得分,取异常得分最大的部分节点作为最终检测结果输出。此检测方法能实现大规模图中电信异常行为高效准确的检测。
-
公开(公告)号:CN115914056A
公开(公告)日:2023-04-04
申请号:CN202110914688.4
申请日:2021-08-10
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04L43/50 , H04L65/1104 , H04L67/02 , H04L67/141
Abstract: 本申请提供一种网络电话服务端的识别方法及装置、系统、电子设备,该方法包括:获取SIP流量,对SIP流量进行分析,获得目的IP信息;根据目的IP信息,对目标服务端的通信端口进行扫描,查找开放服务的目标端口;与开放服务的目标端口建立连接,并向开放服务的目标端口发送HTTP报文;根据HTTP报文的响应消息,确定目标服务端是否为网络电话服务端。由此可以高效地过滤出网络中大部分的VoIP运营平台信息,比传统的被动解析方式需要的资源更少且更加灵活,比传统的主动方式更加高效、目的性更强。在消耗少量资源的情况下,可以高效的进行定向分析,大大提高整体分析的高效性。
-
公开(公告)号:CN115829316A
公开(公告)日:2023-03-21
申请号:CN202211313888.5
申请日:2022-10-25
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06Q10/0635 , H04M3/22 , G06Q10/04 , G06Q30/018 , G06Q30/0202 , G06Q30/0201 , G06F18/214
Abstract: 本申请提供一种信息预警方法、装置、电子设备及存储介质。该方法包括:获取电话语音数据,并根据电话语音数据确定风险主叫号码和风险被叫号码;根据风险被叫号码确定风险被叫用户数据,并根据风险主叫号码确定风险主叫用户数据;获取训练用户画像和训练交易数据,并根据风险被叫用户数据、风险主叫用户数据、训练用户画像和训练交易数据训练预测模型;根据通信平台获取平台用户数据,并利用预测模型根据平台用户信息预警潜在风险用户;其中,平台用户数据,包括:平台用户画像和平台交易数据。本申请可以根据电话语音数据和平台用户数据对潜在的风险用户进行预测,从而提高筛查效率,一定程度上提高了用户交易数据的安全性。
-
公开(公告)号:CN115700583A
公开(公告)日:2023-02-07
申请号:CN202110806934.4
申请日:2021-07-16
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F40/284 , G06F18/2411
Abstract: 本发明公开了一种基于语义网络词表示与注意力图的事件检测方法及装置,包括:拼接每个词的词内容向量、词结构向量与位置特征向量,生成各句子的特征图;结合各词的POS向量进行注意力机制的计算,生成各句子的新特征图;基于新特征图生成句层面特征向量;利用句层面特征向量与词内容向量的拼接结果,获取事件检测结果。本发明综合利用了外部语料库、语义网络、词性和注意力图,并通过优化特征,更准确地抽取触发词,引入了更多信息,解决了一词多义问题,表达了同义词之间的关联信息,得到更精确地事件检测结果。
-
公开(公告)号:CN113761903A
公开(公告)日:2021-12-07
申请号:CN202010504536.2
申请日:2020-06-05
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/289 , G06F40/30 , G06F40/232 , G06F16/35 , G06N3/04
Abstract: 本发明提出一种针对海量高噪音口语化短文本的文本筛选方法,属于自然语言处理领域,通过对训练语料和待筛选的目标文本进行预处理;对预处理后的训练语料中的标注的正类语料进行句式信息提取,区分出业务强相关句式和弱相关句式;利用提取的句式信息对预处理后的目标文本进行句式匹配,将业务强相关句式的匹配结果归为正类文本,对业务弱相关句式的匹配结果进行以下步骤的处理;对目标文本和训练语料都进行文本处理,将处理后的文本转化为词向量表示;使用训练语料的词向量表示训练文本分类模型,将目标文本的词向量表示输入到训练好的文本分类模型中对文本进行分类,实现对目标文本的文本筛选。
-
-
-
-
-
-
-
-
-