-
公开(公告)号:CN116450796A
公开(公告)日:2023-07-18
申请号:CN202310558113.2
申请日:2023-05-17
Applicant: 中国兵器工业计算机应用技术研究所
Inventor: 彭龙 , 孟英谦 , 李胜昌 , 张世超 , 谢志豪 , 邵鹏志 , 任智颖 , 宋彪 , 魏中锐 , 胡明哲 , 李泽宇 , 高圣楠 , 姜伟 , 张子烁 , 葛祥雨 , 邬书豪
IPC: G06F16/332 , G06F16/35 , G06F16/951 , G06F40/126 , G06F40/194 , G06F40/30 , G06N3/0442 , G06N3/0499
Abstract: 本发明涉及一种智能问答模型构建方法及设备,属于自然语言处理技术领域;解决现有技术中的问答模型构建方法得到的问答模型推断速度慢,且答案预测不够准确的问题。本发明的方法包括:获取问答相关领域的多个原始文本数据,构建训练样本集;训练样本集中包括原始文本数据,以及基于原始文本数据得到的标准问题、标准答案和类别标签;构建初始智能问答模型,初始智能问答模型包括特征分类模块和答案预测模块;其中,特征分类模块用于对输入的问题进行分类;答案预测模块用于基于融合了类别信息的问题进行答案预测;基于训练样本集对初始智能问答模型进行训练,经过损失函数迭代更新,得到智能问答模型。
-
公开(公告)号:CN115132219B
公开(公告)日:2024-11-19
申请号:CN202210711617.9
申请日:2022-06-22
Applicant: 中国兵器工业计算机应用技术研究所
Inventor: 邵鹏志 , 谢志豪 , 王乃正 , 孟英谦 , 彭龙 , 李胜昌 , 宋彪 , 邬书豪 , 李泽宇 , 张世超 , 魏中锐 , 任智颖 , 葛祥雨 , 胡明哲 , 霸建民 , 高圣楠 , 张敏
IPC: G10L21/0216 , G10L15/04
Abstract: 本发明涉及一种基于二次谱减法的复杂噪声背景下的语音识别方法和系统,属于语音增强技术领域。该方法包括:选取复杂噪声背景下的含噪历史音频和纯净噪声音频,经过计算处理得到历史噪声估计;对复杂噪声背景下的待识别音频进行分帧处理,得到多帧音频;依次对每帧音频进行处理:基于历史噪声估计和当前帧音频的噪声估计,确定历史噪声移除因子和当前帧音频噪声移除因子,对当前帧音频进行二次谱减,得到当前帧音频降噪后的语音频谱。该方法解决了对于现实世界中的背景噪声复杂采用现有技术无法将残余噪声控制到较低水平的问题。
-
公开(公告)号:CN117950764B
公开(公告)日:2024-09-17
申请号:CN202410139718.2
申请日:2024-01-31
Applicant: 中国兵器工业计算机应用技术研究所
Abstract: 本发明涉及一种基于中间数据的任务断点重跑方法及系统,属于批流一体数据处理领域。本发明方法包括:基于数据处理任务确定相应的DAG图,DAG图用于表示执行所述任务的各任务算子的执行顺序和执行方向;基于DAG图执行数据处理任务,执行时记录输入数据在相应数据源中的偏移位置、各任务算子的执行结果标志,当所述执行结果标志为成功时,记录该任务算子形成的中间数据;其中,所述输入数据为从相应数据源中持续读取的批数据或流数据;在所述任务执行失败时,基于所述执行结果标志以及所述偏移位置或中间数据执行任务断点重跑。本发明方法可以避免失败的批流一体数据处理任务在重跑过程中出现的数据丢失、数据重复等问题,并提升任务重跑效率。
-
公开(公告)号:CN116303977B
公开(公告)日:2023-08-04
申请号:CN202310551556.9
申请日:2023-05-17
Applicant: 中国兵器工业计算机应用技术研究所
Inventor: 孟英谦 , 彭龙 , 李胜昌 , 任智颖 , 邵鹏志 , 谢志豪 , 张世超 , 李泽宇 , 宋彪 , 高圣楠 , 魏中锐 , 胡明哲 , 姜伟 , 张子烁 , 邬书豪 , 葛祥雨
IPC: G06F16/332 , G06F16/35 , G06N3/0442 , G06N3/0464 , G06N3/08 , G06F18/22
Abstract: 本发明涉及一种基于特征分类的问答方法及系统,属于自然语言处理技术领域;解决现有技术中的问答模型推断速度慢,且答案预测不够准确的问题。本发明的问答方法包括以下步骤:获取待处理问题,得到待处理问题对应的类别;在文本语料库中搜索与待处理问题相同类别且相关度最高的原始文本数据;文本语料库包括多个不同类别的原始文本数据;将待处理问题和对应的相关度最大的原始文本数据分别与对应的类别标签融合得到对应的两个带有类别标签信息的特征向量,将两个特征向量输入预先训练的智能问答模型的答案预测模块,基于待处理问题对应的特征向量,在原始文本对应的特征向量中预测得到待处理问题对应的答案。
-
-
-