基于时频掩蔽值估计的波束成形方法及系统

    公开(公告)号:CN112735460B

    公开(公告)日:2021-10-29

    申请号:CN202011557418.4

    申请日:2020-12-24

    Abstract: 本发明属于语音增强技术领域,特别涉及一种基于时频掩蔽值估计的波束成形方法及系统,方法包含:获取多通道语音序列,通过傅里叶变换提取幅度谱特征和空域特征;对幅度谱特征通过对数变换得到多通道语音频谱特征序列,送入预先训练优化的神经网络模型获取复值时频掩蔽值;将复值时频掩蔽值转换为语音存在概率,利用概率模型获取时频掩蔽值;由时频掩蔽值及多通道语音特征序列计算语音信号协方差矩阵,对协方差矩阵进行特征值分解获取波束成形滤波器系数;结合波束成形滤波器系数,利用波束成形滤波器对多通道语音序列语音特征滤波处理,得到增强语音信号。本发明集成神经网络和空域聚类进行时频掩蔽值估计,提升波束形成和语音识别的性能。

    机器翻译双语对照方法及系统

    公开(公告)号:CN112765999A

    公开(公告)日:2021-05-07

    申请号:CN202011545504.3

    申请日:2020-12-24

    Abstract: 本发明属于人工智能翻译技术领域,特别涉及一种机器翻译双语对照方法及系统,用于即时输入内容或上传文件内容翻译的原文和译文对照展示,包含如下内容:将即时输入或上传文件内容的原文分别送入翻译引擎,获取与原文对应的译文,并生成用于设置原文和译文相同文本样式属性的展示模板;依据展示模板将原文和译文以左右方向在目标页面进行对照显示。本发明解决现有双语翻译中信息捕捉效率低、体验差等问题,通过设置相同展示模板,便于原文和译文对齐展示,提升用户原文和译文中信息捕捉效率,利于目标词句或段落的精准定位显示,提升用户体验,具有较好的应用前景。

Patent Agency Ranking