-
公开(公告)号:CN113761919B
公开(公告)日:2025-01-07
申请号:CN202010500426.9
申请日:2020-06-04
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/295 , G06F40/211
Abstract: 本发明提供一种口语化短文本的实体属性提取方法及电子装置,包括对口语化短文本切词及词性标注,并对各标注词性的词语进行命名主体识别,得到实体词语;将口语化短文本映射为主谓宾三元组,获取主谓宾三元组中各词语的依存关系,并使用实体词语对主谓宾三元组中各词语进行实体识别;当主谓宾三元组中的主谓宾满足一触发规则时,提取宾语词组作为实体属性。本发明采用词性标注、依存句法分析、实体识别以及结合触发词词性规则的综合方法,更加有针对性的提取了口语化短数据的实体属性信息,丰富了口语化短文本领域的结构化信息抽取方法。
-
公开(公告)号:CN118332103A
公开(公告)日:2024-07-12
申请号:CN202410507046.6
申请日:2024-04-25
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/34 , G06F16/35 , G06F16/33 , G06F16/332 , G06F40/30 , G06F40/284 , G06N3/0455 , G06N3/047 , G06N3/084
Abstract: 本公开提供一种主题提取方法、装置、相关设备和计算机程序产品,涉及计算机与互联网技术领域。主题提取方法包括:获取多个文本和多个热点关键词,热点关键词是从网络中获得的;根据多个热点关键词对各个文本分别进行关键词匹配,以确定各个文本中的文本关键词;通过文本关键词对多个文本进行文本聚类,以确定至少一个文本组;将每个文本组中命中热点关键词最多的文本作为文本组的主题。本公开实施例可以快速且准确的从多个文本中提取出主题信息。
-
公开(公告)号:CN115700583A
公开(公告)日:2023-02-07
申请号:CN202110806934.4
申请日:2021-07-16
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F40/284 , G06F18/2411
Abstract: 本发明公开了一种基于语义网络词表示与注意力图的事件检测方法及装置,包括:拼接每个词的词内容向量、词结构向量与位置特征向量,生成各句子的特征图;结合各词的POS向量进行注意力机制的计算,生成各句子的新特征图;基于新特征图生成句层面特征向量;利用句层面特征向量与词内容向量的拼接结果,获取事件检测结果。本发明综合利用了外部语料库、语义网络、词性和注意力图,并通过优化特征,更准确地抽取触发词,引入了更多信息,解决了一词多义问题,表达了同义词之间的关联信息,得到更精确地事件检测结果。
-
公开(公告)号:CN110556114B
公开(公告)日:2022-06-17
申请号:CN201910684343.7
申请日:2019-07-26
Applicant: 国家计算机网络与信息安全管理中心 , 北京邮电大学
IPC: G10L17/18 , G10L17/04 , H04M1/656 , H04M1/72454 , H04M1/72403
Abstract: 本发明公开了一种基于注意力机制的说话人识别方法及装置,包括如下步骤:采集多个被测试通话人的通话录音和测试通话人的通话录音;根据所述被测试通话人对应的通话录音,建立通话人语音库;采用基于注意力的神经网络对所述被测试通话人语音进行训练,获得训练模型;存储所述测试通话人的通话录音,获得录音文件;将所述录音文件采用所述训练模型识别所述被测试通话人是否目标通话人。通过采用基于注意力的神经网络对所述被测试通话人语音进行训练,获得训练模型,采用训练模型识别所述被测试通话人,确认了拨号码对应的主人的一致性,避免了由于通话人身份被仿冒带来的通信安全隐患,进一步提高了通话过程中的信息的安全性。
-
公开(公告)号:CN108520740B
公开(公告)日:2022-04-19
申请号:CN201810332970.X
申请日:2018-04-13
Applicant: 国家计算机网络与信息安全管理中心 , 天津市国瑞数码安全系统股份有限公司
Abstract: 本发明属于音频分析技术领域,具体而言,涉及一种基于多种特征的音频内容一致性分析方法和分析系统,分析方法包括获取语音样本;对所述语音样本的音频模型进行基于多种特征的分析;对所述音频模型的分析结果进行评分设定;对评分设定后的所述音频模型的一致性进行综合特征模型分析;根据所述综合特征模型分析得出所述语音样本的分析结果。分析系统包括数据查询管理系统、数据存储系统、实时分析系统、实时评分系统和模型自学习系统。本发明提供的基于多种特征的音频内容一致性分析方法和分析系统能够根据多个特征对音频内容进行归类,具有分析识别准确度高的特点。
-
公开(公告)号:CN113761919A
公开(公告)日:2021-12-07
申请号:CN202010500426.9
申请日:2020-06-04
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/295 , G06F40/211
Abstract: 本发明提供一种口语化短文本的实体属性提取方法及电子装置,包括对口语化短文本切词及词性标注,并对各标注词性的词语进行命名主体识别,得到实体词语;将口语化短文本映射为主谓宾三元组,获取主谓宾三元组中各词语的依存关系,并使用实体词语对主谓宾三元组中各词语进行实体识别;当主谓宾三元组中的主谓宾满足一触发规则时,提取宾语词组作为实体属性。本发明采用词性标注、依存句法分析、实体识别以及结合触发词词性规则的综合方法,更加有针对性的提取了口语化短数据的实体属性信息,丰富了口语化短文本领域的结构化信息抽取方法。
-
公开(公告)号:CN113761903A
公开(公告)日:2021-12-07
申请号:CN202010504536.2
申请日:2020-06-05
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/289 , G06F40/30 , G06F40/232 , G06F16/35 , G06N3/04
Abstract: 本发明提出一种针对海量高噪音口语化短文本的文本筛选方法,属于自然语言处理领域,通过对训练语料和待筛选的目标文本进行预处理;对预处理后的训练语料中的标注的正类语料进行句式信息提取,区分出业务强相关句式和弱相关句式;利用提取的句式信息对预处理后的目标文本进行句式匹配,将业务强相关句式的匹配结果归为正类文本,对业务弱相关句式的匹配结果进行以下步骤的处理;对目标文本和训练语料都进行文本处理,将处理后的文本转化为词向量表示;使用训练语料的词向量表示训练文本分类模型,将目标文本的词向量表示输入到训练好的文本分类模型中对文本进行分类,实现对目标文本的文本筛选。
-
公开(公告)号:CN111698685A
公开(公告)日:2020-09-22
申请号:CN202010541713.4
申请日:2020-06-15
Applicant: 珠海高凌信息科技股份有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及一种识别伪装成携号转网号码的虚假主叫的系统和方法的技术方案,包括:通过本网GMSC用于对具有不同NDC归属运营商的主叫号码与被叫号码进行号码状态查询,获取所述主叫号码的第一状态;根据所述第一状态对查询结果中已进行携号转网的所述主叫号码通过所述转发网关发送ATI消息;通过所述ATI消息获取所述主叫号码的第二状态,根据所述第一状态或第二状态对所述主叫号码进行放行或防护。本发明的有益效果为:通过新增网元,修改现网网元机制,达到获取携号转网用户状态的目标,实现对伪装携号转网号码的识别。
-
公开(公告)号:CN111556013A
公开(公告)日:2020-08-18
申请号:CN202010213472.0
申请日:2020-03-24
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: H04L29/06
Abstract: 本发明公开了一种复杂大流量下VoIP恶意行为发现方法,其步骤包括:1)从网络流量中筛选出VoIP呼叫信令;2)利用设定的过滤门限对VoIP呼叫信令进行筛选,找出可疑的网络流量;3)提取可疑的网络流量中的每一被叫账号的历史呼叫信令数据,统计分析得到该被叫账号的呼叫行为特征与对应阈值进行对比,确定该被叫账号是否受到恶意攻击。本发明能够针对复杂实时数据流进行全面细致的检测,充分挖掘历史数据,有效检测VoIP恶意行为,更好地应对复杂度高、隐蔽性高的VoIP恶意行为。
-
公开(公告)号:CN111091809A
公开(公告)日:2020-05-01
申请号:CN201911051663.5
申请日:2019-10-31
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
Abstract: 本发明提供一种深度特征融合的地域性口音识别方法和装置,方法包括:提取待识别语音的瓶颈BN特征和滑动差分倒谱SDC特征;将瓶颈BN特征和滑动差分倒谱SDC特征输入预先训练后的支持向量机SVM分类器中,得到输出的待识别语音的语音类别。本发明采用多特征融合的语种识别系统,提取语音的深度特征,融合传统的SDC特征,输入SVM分类器,实现更鲁棒的语种识别功能,取得了对地域性方言普通话较好的分类效果。
-
-
-
-
-
-
-
-
-