-
公开(公告)号:CN119091861A
公开(公告)日:2024-12-06
申请号:CN202411149307.8
申请日:2024-08-21
Applicant: 国家计算机网络与信息安全管理中心
IPC: G10L15/02 , G10L15/06 , G10L15/16 , G10L15/183 , G10L15/26 , G10L21/0232 , G10L19/26
Abstract: 本发明涉及语音转写领域,尤其涉及基于人工智能的语音转写加速方法,包括以下步骤:(S1)获取原始语音数据,对获取的原始语音数据先预处理再增强处理,对增强后的语音数据进行特征提取,得到语音特征,基于语音特征进行语音识别,得到识别结果;(S2)根据识别结果生成初步转写文本,通过自适应动态文本优化算法对初步撰写文本进行优化,得到优化后的转写文本,同时在转写过程中通过优化加速算法优化转写效率。本发明公开的基于人工智能的语音转写加速方法,减少了背景噪声和其他干扰,提高了最终撰写文本的准确性和速度。
-
公开(公告)号:CN119046775A
公开(公告)日:2024-11-29
申请号:CN202411131128.1
申请日:2024-08-17
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/2411 , G06F18/213 , G06N3/042 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及信息技术领域,具体公开了一种基于图神经网络的异常用户分类方法,包括:S1、数据预处理与图构建,S2、节点表示分解,S3、生成基于同配度矩阵的伪标签,S4、信号聚合,S5、模型设计,S6、损失函数设计和S7、节点分类方法;本发明使用Weisfeiler‑Lehman同构测试和同配度矩阵的伪标签生成方法,能够有效地减少训练时间和计算资源,高效的信号聚合方法也使得推理过程更加快速;通过分解节点表示和伪标签生成的方法,使得模型在做出决策时更加透明,可以理解模型是如何利用同配性和异配性信息进行判断的,从而增加了模型的可解释性和精度。
-
公开(公告)号:CN113420121B
公开(公告)日:2023-07-28
申请号:CN202110704938.1
申请日:2021-06-24
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/33 , G06F16/332 , G06F16/951 , G06F18/214
Abstract: 本申请提供了一种文本处理模型训练方法、语音文本处理方法及装置,涉及自然语言处理技术领域。该方法包括:从互联网爬取对话文本,得到正样本;对对话文本中的语句进行变换操作,得到负样本和负样本的第一标签信息;将正样本和负样本对应输入至预先训练的第一文本处理模型中和待训练的第二文本处理模型中,生成第一文本处理模型的目标层的第一特征向量和第二文本处理模型的目标层的第二特征向量;根据第一特征向量、第二特征向量,对第二文本处理模型进行知识蒸馏,得到训练好的第二文本处理模型。根据本申请实施例,能够解决相关技术中对语音文本进行校对效率低、耗时长且计算资源占用大的问题。
-
公开(公告)号:CN113420111A
公开(公告)日:2021-09-21
申请号:CN202110674586.X
申请日:2021-06-17
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/33 , G06F16/332 , G06F40/126 , G06F40/289 , G06F40/30 , G06K9/62 , G06N3/02
Abstract: 本申请实施例公开了一种用于多跳推理问题的智能问答方法及装置,方法包括:获取问题文本;对问题文本进行语义编码,获得问题文本的语义编码表示;根据问题文本的语义编码表示,确定第一预测结果,第一预测结果为问题文本的至少一个问题主体所在位置的预测结果;根据问题文本的语义编码表示,确定第二预测结果,第二预测结果为问题文本的至少一个问题关系的预测结果;根据第一预测结果和第二预测结果,生成子问题文本,子问题文本包括至少一个子问题;根据筛选文档,对至少一个子问题依次进行回答,获得与至少一个子问题对应的答案,筛选文档包括至少一个子问题对应的答案;根据至少一个子问题对应的答案,确定问题文本的最终答案。
-
公开(公告)号:CN114420100B
公开(公告)日:2022-06-21
申请号:CN202210321299.5
申请日:2022-03-30
Applicant: 中国科学院自动化研究所
Abstract: 本公开涉及一种语音检测方法及装置、电子设备及存储介质,所述方法包括:对待检测语音进行声学特征提取,得到第一声学特征和第二声学特征;将第一声学特征序列输入预先训练好的采样率预测模型,得到采样率信息特征;将第二声学特征和采样率信息特征输入预先训练好的语音检测模型,得到待检测语音为真实语音或合成语音的分类结果,结合采样率信息特征对待检测语音进行检测,能够对实际场景中音频进行音频质量的快速判别,帮助语音检测模型对实际音频的不同频带进行更加有侧重的识别,避免假高频语音对模型判别进行干扰,提高检测模型的分类精确度。
-
公开(公告)号:CN114420100A
公开(公告)日:2022-04-29
申请号:CN202210321299.5
申请日:2022-03-30
Applicant: 中国科学院自动化研究所
Abstract: 本公开涉及一种语音检测方法及装置、电子设备及存储介质,所述方法包括:对待检测语音进行声学特征提取,得到第一声学特征和第二声学特征;将第一声学特征序列输入预先训练好的采样率预测模型,得到采样率信息特征;将第二声学特征和采样率信息特征输入预先训练好的语音检测模型,得到待检测语音为真实语音或合成语音的分类结果,结合采样率信息特征对待检测语音进行检测,能够对实际场景中音频进行音频质量的快速判别,帮助语音检测模型对实际音频的不同频带进行更加有侧重的识别,避免假高频语音对模型判别进行干扰,提高检测模型的分类精确度。
-
-
-
-
-