-
公开(公告)号:CN110708418B
公开(公告)日:2021-06-29
申请号:CN201910848492.2
申请日:2019-09-09
Applicant: 国家计算机网络与信息安全管理中心 , 北京邮电大学
IPC: H04M1/72484 , H04M1/72403 , H04M1/72454 , H04M1/57 , G10L25/54 , G10L25/03
Abstract: 本发明公开了一种识别呼叫方属性的方法及装置,涉及通信技术领域,包括:接收到第二设备的通话请求后,与所述第二设备建立通话连接;获取所述第二设备发送的语音数据;提取所述语音数据的噪声特征,作为待处理噪声特征;所述噪声特征包括以下任意一项或多项:期望、熵和超熵;在预先建立的噪声特征与属性标签的对应关系中,查找所述待处理噪声特征对应的属性标签,作为所述第二设备的第一属性。本发明通过噪声特征来识别呼叫方的属性,相比于现有技术提升了识别准确性。
-
公开(公告)号:CN110545359B
公开(公告)日:2021-06-29
申请号:CN201910713518.2
申请日:2019-08-02
Applicant: 国家计算机网络与信息安全管理中心 , 北京邮电大学
IPC: H04M3/22
Abstract: 本发明公开了一种通信线路特征提取方法、通信线路识别方法及装置。所述方法包括:通过运营商通信线路建立位于主叫地的主叫终端与位于被叫地的被叫终端之间的通话连接;在所述主叫终端处播放语音;在所述被叫终端处获取所述语音对应的音频;从所述音频中提取音频特征作为通信线路特征,所述通信线路特征为所述主叫地与所述被叫地之间的所述运营商通信线路的特征,从而有助于准确且高效的识别相应的运营商和来源地,进而提高用户通话的可靠性。
-
公开(公告)号:CN112989839A
公开(公告)日:2021-06-18
申请号:CN201911309397.1
申请日:2019-12-18
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/30 , G06F40/284
Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于关键词特征嵌入语言模型的意图识别方法,包括:采用前后向最大分词算法,对提取的有效文本的语言信息进行分词,获得不同类别的分词结果;针对获得的不同类别的分词结果,获得不同类别的分词结果对应的候选意图相关的关键词列表;剔除每一种类别的分词结果对应的候选意图相关的关键词列表中的通用高频词和领域无关词,获得每一种类别的分词结果对应的最终关键词表,进而获得不同的关键词特征向量;将获得的每一个关键词特征向量嵌入至预先训练好的语言模型,获得带有关键词特征的有效文本的语音信息;并对其进行编码和分类,获得该有效文本的语言信息的意图识别结果。
-
公开(公告)号:CN110602332B
公开(公告)日:2021-06-15
申请号:CN201910708779.5
申请日:2019-08-01
Applicant: 国家计算机网络与信息安全管理中心 , 北京邮电大学
Abstract: 本发明公开了一种通信线路特征提取方法、通信线路识别方法及装置。所述通信线路特征提取方法包括:获取主叫端与被叫端之间的通话音频;对所述通话音频进行处理,以去除所述通话音频中的人声音频;分别采用差分方法、频率划分方法和自编码网络方法从处理后的通话音频中对应提取第一噪声特征、第二噪声特征和第三噪声特征,并将所述第一噪声特征、所述第二噪声特征和所述第三噪声特征作为所述主叫端与所述被叫端之间的通信线路特征,从而能够准确且高效的提取通信线路特征,进而提高通信线路识别的准确性和高效性,提高电话通信的可靠性。
-
公开(公告)号:CN110267272A
公开(公告)日:2019-09-20
申请号:CN201910572213.4
申请日:2019-06-28
Applicant: 国家计算机网络与信息安全管理中心 , 天津市国瑞数码安全系统股份有限公司
Abstract: 本发明涉及一种诈骗短信识别方法及识别系统,该方法包括:收集多条历史诈骗短信的相关数据,并从每条历史诈骗短信的相关数据提取历史诈骗短信的特征向量和诈骗类别;根据历史诈骗短信的特征向量和诈骗类别进行诈骗短信模型训练,获取诈骗短信判断模型;接收新短信的相关数据,并从每条新短信的相关数据中提取新短信的特征向量;将新短信的特征向量输入诈骗短信判断模型中,获取新短信是否属于诈骗短信以及属于哪种诈骗类别。本发明收集并根据多条历史诈骗短信的相关数据获取诈骗短信判断模型,该诈骗短信判断模型基于历史诈骗短信的相关数据,不限于短信内容,使得诈骗短信判断模型能够从多方面综合判断新短信是否属于诈骗短信以及哪种诈骗短信。
-
公开(公告)号:CN110119648A
公开(公告)日:2019-08-13
申请号:CN201810111564.0
申请日:2018-02-05
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院声学研究所
Abstract: 本发明公开了一种基于光学字符识别的传真图像分类方法,所述方法包括:步骤1)对扫描得到的传真图像进行噪声消除;步骤2)对噪声消除后的传真图像进行二值化处理;步骤3)对步骤2)得到的二值化图像进行仿射变换校准文本;步骤4)利用OCR方法对步骤3)处理后的传真图像进行识别,得到编码为UTF-8的输出字符串和转写置信度;步骤5)对字符串进行关键词正则匹配,得到传真图像的分类。本发明的方法利用频谱噪声消除和灰度图像二值化的预处理,在满足实时性要求的前提下提升了电子扫描得到的传真图像的质量;使传真图像能够使用基于OCR的分类方法,由此实现了传真图像的自动化分类。
-
公开(公告)号:CN113761919B
公开(公告)日:2025-01-07
申请号:CN202010500426.9
申请日:2020-06-04
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/295 , G06F40/211
Abstract: 本发明提供一种口语化短文本的实体属性提取方法及电子装置,包括对口语化短文本切词及词性标注,并对各标注词性的词语进行命名主体识别,得到实体词语;将口语化短文本映射为主谓宾三元组,获取主谓宾三元组中各词语的依存关系,并使用实体词语对主谓宾三元组中各词语进行实体识别;当主谓宾三元组中的主谓宾满足一触发规则时,提取宾语词组作为实体属性。本发明采用词性标注、依存句法分析、实体识别以及结合触发词词性规则的综合方法,更加有针对性的提取了口语化短数据的实体属性信息,丰富了口语化短文本领域的结构化信息抽取方法。
-
公开(公告)号:CN118332103A
公开(公告)日:2024-07-12
申请号:CN202410507046.6
申请日:2024-04-25
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/34 , G06F16/35 , G06F16/33 , G06F16/332 , G06F40/30 , G06F40/284 , G06N3/0455 , G06N3/047 , G06N3/084
Abstract: 本公开提供一种主题提取方法、装置、相关设备和计算机程序产品,涉及计算机与互联网技术领域。主题提取方法包括:获取多个文本和多个热点关键词,热点关键词是从网络中获得的;根据多个热点关键词对各个文本分别进行关键词匹配,以确定各个文本中的文本关键词;通过文本关键词对多个文本进行文本聚类,以确定至少一个文本组;将每个文本组中命中热点关键词最多的文本作为文本组的主题。本公开实施例可以快速且准确的从多个文本中提取出主题信息。
-
公开(公告)号:CN110556114B
公开(公告)日:2022-06-17
申请号:CN201910684343.7
申请日:2019-07-26
Applicant: 国家计算机网络与信息安全管理中心 , 北京邮电大学
IPC: G10L17/18 , G10L17/04 , H04M1/656 , H04M1/72454 , H04M1/72403
Abstract: 本发明公开了一种基于注意力机制的说话人识别方法及装置,包括如下步骤:采集多个被测试通话人的通话录音和测试通话人的通话录音;根据所述被测试通话人对应的通话录音,建立通话人语音库;采用基于注意力的神经网络对所述被测试通话人语音进行训练,获得训练模型;存储所述测试通话人的通话录音,获得录音文件;将所述录音文件采用所述训练模型识别所述被测试通话人是否目标通话人。通过采用基于注意力的神经网络对所述被测试通话人语音进行训练,获得训练模型,采用训练模型识别所述被测试通话人,确认了拨号码对应的主人的一致性,避免了由于通话人身份被仿冒带来的通信安全隐患,进一步提高了通话过程中的信息的安全性。
-
公开(公告)号:CN108520740B
公开(公告)日:2022-04-19
申请号:CN201810332970.X
申请日:2018-04-13
Applicant: 国家计算机网络与信息安全管理中心 , 天津市国瑞数码安全系统股份有限公司
Abstract: 本发明属于音频分析技术领域,具体而言,涉及一种基于多种特征的音频内容一致性分析方法和分析系统,分析方法包括获取语音样本;对所述语音样本的音频模型进行基于多种特征的分析;对所述音频模型的分析结果进行评分设定;对评分设定后的所述音频模型的一致性进行综合特征模型分析;根据所述综合特征模型分析得出所述语音样本的分析结果。分析系统包括数据查询管理系统、数据存储系统、实时分析系统、实时评分系统和模型自学习系统。本发明提供的基于多种特征的音频内容一致性分析方法和分析系统能够根据多个特征对音频内容进行归类,具有分析识别准确度高的特点。
-
-
-
-
-
-
-
-
-