-
公开(公告)号:CN115700583A
公开(公告)日:2023-02-07
申请号:CN202110806934.4
申请日:2021-07-16
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F40/284 , G06F18/2411
Abstract: 本发明公开了一种基于语义网络词表示与注意力图的事件检测方法及装置,包括:拼接每个词的词内容向量、词结构向量与位置特征向量,生成各句子的特征图;结合各词的POS向量进行注意力机制的计算,生成各句子的新特征图;基于新特征图生成句层面特征向量;利用句层面特征向量与词内容向量的拼接结果,获取事件检测结果。本发明综合利用了外部语料库、语义网络、词性和注意力图,并通过优化特征,更准确地抽取触发词,引入了更多信息,解决了一词多义问题,表达了同义词之间的关联信息,得到更精确地事件检测结果。
-
公开(公告)号:CN115081437B
公开(公告)日:2022-12-09
申请号:CN202210855918.9
申请日:2022-07-20
Applicant: 中国电子科技集团公司第三十研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/279 , G06F40/253 , G06F40/242 , G06F40/216 , G06F40/211 , G06F40/30 , G06F16/33
Abstract: 本发明涉及文本检测技术领域,公开了基于语言学特征对比学习的机器生成文本检测方法及系统,该机器生成文本检测方法,包括以下步骤:S1,预训练模型调整;S2,话语图构建;S3,向量表示计算;S4,文本检测参数更新。本发明解决了现有技术存在的在标注数据有限的情况下自动准确识别网络中的机器生成文本等问题。
-
公开(公告)号:CN114915599B
公开(公告)日:2022-11-11
申请号:CN202210845605.5
申请日:2022-07-19
Applicant: 中国电子科技集团公司第三十研究所 , 国家计算机网络与信息安全管理中心
IPC: H04L47/2483 , H04L47/2441 , G06N3/04 , G06N3/08 , G06K9/62
Abstract: 本发明涉及计算机网络技术领域,公开了一种基于半监督聚类学习的暗网站点会话识别方法及系统,该会话识别方法,利用深度学习CNN算法自动提取Obfs4网桥下暗网站点会话的特征,并利半监督聚类算法对暗网站点的onion地址进行识别。本发明解决了现有技术存在的泛化性不足、识别准确度较低、实用性不足等问题。
-
公开(公告)号:CN114936723A
公开(公告)日:2022-08-23
申请号:CN202210856300.4
申请日:2022-07-21
Applicant: 中国电子科技集团公司第三十研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及数据挖掘技术领域,公开了一种基于数据增强的社交网络用户属性预测方法及系统,该属性预测方法,基于用户的历史行为序列,推断用户未来一段时间的行为序列,通过将历史行为序列与预测得到的行为序列进行拼接,扩大行为序列的长度,对用户的行为数据进行增强。本发明解决了现有技术存在的线网络用户行为序列长度较短时不能为用户属性预测任务提供足够信息、从而导致用户属性预测的预测准确性低的问题。
-
公开(公告)号:CN110556114B
公开(公告)日:2022-06-17
申请号:CN201910684343.7
申请日:2019-07-26
Applicant: 国家计算机网络与信息安全管理中心 , 北京邮电大学
IPC: G10L17/18 , G10L17/04 , H04M1/656 , H04M1/72454 , H04M1/72403
Abstract: 本发明公开了一种基于注意力机制的说话人识别方法及装置,包括如下步骤:采集多个被测试通话人的通话录音和测试通话人的通话录音;根据所述被测试通话人对应的通话录音,建立通话人语音库;采用基于注意力的神经网络对所述被测试通话人语音进行训练,获得训练模型;存储所述测试通话人的通话录音,获得录音文件;将所述录音文件采用所述训练模型识别所述被测试通话人是否目标通话人。通过采用基于注意力的神经网络对所述被测试通话人语音进行训练,获得训练模型,采用训练模型识别所述被测试通话人,确认了拨号码对应的主人的一致性,避免了由于通话人身份被仿冒带来的通信安全隐患,进一步提高了通话过程中的信息的安全性。
-
公开(公告)号:CN113761919A
公开(公告)日:2021-12-07
申请号:CN202010500426.9
申请日:2020-06-04
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/295 , G06F40/211
Abstract: 本发明提供一种口语化短文本的实体属性提取方法及电子装置,包括对口语化短文本切词及词性标注,并对各标注词性的词语进行命名主体识别,得到实体词语;将口语化短文本映射为主谓宾三元组,获取主谓宾三元组中各词语的依存关系,并使用实体词语对主谓宾三元组中各词语进行实体识别;当主谓宾三元组中的主谓宾满足一触发规则时,提取宾语词组作为实体属性。本发明采用词性标注、依存句法分析、实体识别以及结合触发词词性规则的综合方法,更加有针对性的提取了口语化短数据的实体属性信息,丰富了口语化短文本领域的结构化信息抽取方法。
-
公开(公告)号:CN113420112A
公开(公告)日:2021-09-21
申请号:CN202110685518.3
申请日:2021-06-21
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/33 , G06F40/289 , G06K9/62
Abstract: 本发明涉及一种基于无监督学习的新闻实体分析方法及装置。方法包括:对待处理的多条新闻数据中的每条新闻数据分别进行分词处理,将分词处理后的每条新闻中包含的多个实体进行标注以得到标注结果;基于所述标注结果构建分布式表示模型,得到所述多个实体的分布式表示信息,所述分布式表示信息标识为实体向量;根据所述多个实体的分布式表示信息,对所述多个实体进行聚类分析以得到聚类结果。本申请将分布式的思想引入新闻实体的处理当中,通过新闻实体所处位置的上下文来得到实体的分布式表示,通过对实体的聚类分析来得到实体的聚类结果。
-
公开(公告)号:CN110059889B
公开(公告)日:2021-05-28
申请号:CN201910344174.2
申请日:2019-04-26
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提供了基于无监督学习的诈骗呼叫序列检测方法,包括:构造主叫呼叫序列和呼叫二部图;在呼叫二部图中进行随机游走过程,推断各主叫号码对应节点的低维嵌入表示向量;获取各被叫号码的唯一标识,以主叫号码对应节点的低维嵌入表示向量以及第M个被叫号码对应的唯一标识为神经网络的输入,以第M+1个被叫号码对应的唯一标识为输出,训练获得神经网络预测模型;获取待检测主叫呼叫序列中主叫号码对应节点的低维嵌入表示向量以及各被叫号码对应的唯一标识,并输入所述神经网络预测模型,若得到的预测唯一标识与实际唯一标识的误差大于设定阈值,则判断主叫号码为诈骗号码。本发明中提出的方法容易实现并行化计算,可以实现较高的检测效率。
-
公开(公告)号:CN111698685A
公开(公告)日:2020-09-22
申请号:CN202010541713.4
申请日:2020-06-15
Applicant: 珠海高凌信息科技股份有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及一种识别伪装成携号转网号码的虚假主叫的系统和方法的技术方案,包括:通过本网GMSC用于对具有不同NDC归属运营商的主叫号码与被叫号码进行号码状态查询,获取所述主叫号码的第一状态;根据所述第一状态对查询结果中已进行携号转网的所述主叫号码通过所述转发网关发送ATI消息;通过所述ATI消息获取所述主叫号码的第二状态,根据所述第一状态或第二状态对所述主叫号码进行放行或防护。本发明的有益效果为:通过新增网元,修改现网网元机制,达到获取携号转网用户状态的目标,实现对伪装携号转网号码的识别。
-
公开(公告)号:CN110266902A
公开(公告)日:2019-09-20
申请号:CN201910444314.3
申请日:2019-05-27
Applicant: 国家计算机网络与信息安全管理中心 , 南京中新赛克科技有限责任公司
Abstract: 本发明公开了一种VoIP信令与媒体数据关联系统、方法及计算机存储介质,系统包括识别过滤装置、解析处理装置、核心关联装置和数据分析反馈装置,方法上采用多维度数据对互联网VoIP网络电话协议信令与媒体数据进行关联。本发明从功能上,既保证了关联结果的高质量性,又保证关联结果的高数量性;从可靠性上,对关联结果的后续分析并将分析结果反馈给关联使用,逐步优化系统的关联效果;从可扩展性上,采用多装置处理的方式,使得需要拓展功能时,只需要修改或者扩展单装置功能而不影响整体的功能以及效果。
-
-
-
-
-
-
-
-
-