一种语音编码器码流的转码方法

    公开(公告)号:CN103236262A

    公开(公告)日:2013-08-07

    申请号:CN201310175404.X

    申请日:2013-05-13

    Abstract: 本发明公开了一种语音编码器码流的转码方法,属于语音编解码技术领域。通信网1发送的A码流经过比特流解析单元,解码单元,参数转换单元、编码单元和比特流封装单元得到通信网2接收的B码流,所述通信网1、2是使用不同语音编码标准的通信网络。

    一种窄带码流转换为宽带码流的转换装置

    公开(公告)号:CN102543089B

    公开(公告)日:2013-04-17

    申请号:CN201210014117.6

    申请日:2012-01-17

    Abstract: 本发明公开了一种窄带码流转换为宽带码流的转换装置及其转换方法,所述的装置包括扩展单元和训练单元,所述的扩展单元包括窄带码流分离单元、窄带码流解析单元、窄带能量计算单元、码书映射单元、函数映射单元、高频时域包络及频域包络编码单元、高频能量编码单元、码流合成单元以及高频能量解码单元。所述的方法包括以下步骤:窄带码流解析;码书映射;窄带能量计算;函数映射;编码和码流合成。本发明第一次实现了将G.729编码得到的窄带码流扩展成可以作为G.729.1解码器输入的宽带码流,可以直接将现有电话通信网络传来的窄带码流直接通过G.729.1解码输出得到宽带语音,实现了宽带终端对窄带终端的兼容。

    一种基于高阶特征和注意力机制的多模态单目深度估计方法

    公开(公告)号:CN119515944A

    公开(公告)日:2025-02-25

    申请号:CN202411512404.9

    申请日:2024-10-28

    Inventor: 邹迎 陈喆 殷福亮

    Abstract: 本发明公开了一种基于高阶特征和注意力机制的多模态单目深度估计方法,包括:获取单目RGB图和对应的真实深度图,并对训练集中的单目RGB图进行数据增强处理;构造基于高阶特征和注意力机制的多模态单目深度估计网络模型,构建多模态单目深度估计网络模型的损失函数,利用划分好的训练集训练所述多模态单目深度估计网络模型,在训练过程的反向传播中,其中梯度值通过链式法则传递,并采用优化算法更新该网络模型的参数,通过多次迭代训练,逐渐收敛控制损失函数在训练数据上的值最小,获得最佳权重;将测试集中的图像输入至具有最佳权重的多模态单目深度估计网络模型中,获得RGB单目图对应的预测深度图。

    一种基于鲁棒的势概率假设密度的声学同步定位与地图构建方法

    公开(公告)号:CN119335481A

    公开(公告)日:2025-01-21

    申请号:CN202411468856.1

    申请日:2024-10-21

    Abstract: 本发明公开了一种基于鲁棒的势概率假设密度的声学同步定位与地图构建方法,具体包括:对声源状态和DoA观测数据的势概率假设密度进行递归传播;将声源到机器人的距离最小值和距离最大值进行均匀分布;将DoA观测数据和声源状态缺失距离信息合成为声源状态出生势概率假设密度的均值;采用无迹卡尔曼滤波器对声源状态势概率假设密度的均值和协方差进行更新;使用变分贝叶斯方法计算近似的势概率假设密度似然概率;采用单特征策略生成机器人位姿粒子权值,对机器人位姿粒子权值进行重采样操作;将更新后的声源状态势概率假设密度的均值和协方差进行修剪和合并,当势概率假设密度的权值大于设定阈值时,则所对应的势概率假设密度的均值为声源位置,符合条件的势概率假设密度的权值数目为声源数目。

    一种基于单簇概率假设密度的声学同步定位与建图方法

    公开(公告)号:CN119104982A

    公开(公告)日:2024-12-10

    申请号:CN202411151789.0

    申请日:2024-08-21

    Abstract: 本发明公开了一种基于单簇概率假设密度的声学同步定位与建图方法,具体包括:对声源状态和DoA观测的概率假设密度的权值、均值和协方差进行递归传播;将声源到机器人的距离最小值和距离最大值进行均匀分布,根据DoA观测值和声源状态缺失距离信息作为声源状态出生概率假设密度的均值,使用粒子群优化算法对声源状态概率假设密度均值进行优化;通过无迹卡尔曼滤波器更新优化后声源状态概率假设密度均值和协方差;采用单簇策略生成机器人位姿粒子权值,将机器人位姿粒子权值与Rao‑Blackwellized滤波器粒子进行加权平均获得机器人位姿估计,将更新后的概率假设密度权值、均值和协方差进行修剪和合并,将概率假设密度权值大于设定阈值所对应的概率假设密度均值为声源位置,符合条件的概率假设密度权值数目为声源数目。

    一种基于FxLMS结构的主动降噪系统、方法及设备

    公开(公告)号:CN118251717A

    公开(公告)日:2024-06-25

    申请号:CN202180103653.0

    申请日:2021-11-02

    Abstract: 本申请公开了一种基于FxLMS结构的主动降噪系统、方法及设备,包括:初级通路自适应滤波器、次级通路自适应滤波器及子带滤波器组,子带滤波器组用于基于目标播放声音调整次级通路自适应滤波器的滤波器系数。系统在现有FxLMS结构基础上,增加子带滤波器组,使得在主动降噪设备播放目标声音(如音乐信号)的过程中,利用子带滤波器组将目标播放声音白噪声化,消除相关性(这是因为音乐信号的相关性强,特征值接近零,步长需设得较小,严重影响自适应滤波器收敛速度)以得到实时的次级通路自适应滤波器的滤波器系数,比起利用白噪声进行次级通路建模的离线方式,直接利用目标播放声音实时在线建模提高了用户舒适度,更具有实用性,且能实时动态自行调整。

    一种检测电阻、电容及电感主要参数的测量系统

    公开(公告)号:CN116699244A

    公开(公告)日:2023-09-05

    申请号:CN202310691320.5

    申请日:2023-06-12

    Abstract: 本发明公开了一种检测电阻、电容及电感主要参数的测量系统,包括:信号发生器模块,用于生成激励信号,信号调理模块,将信号发生模块输出的模拟激励信号转换为待测的模拟电压信号,信号调理模块包括功率放大器、待测元件、阻抗匹配器、三个标准电阻、三个开关,信号处理模块,接收信号调理模块输出的第一模拟电压信号和第二模拟电压信号并进行分析获得两路模拟电压信号的比值和相位差,从而得到待测元件的主要参数;包括左声道的模数转换器和右声道的模数转换器;结果显示模块,用于显示待测元件的主要参数;对于待测元件未知值,均可以通过系统调整标准电阻以及自动调整混合正弦波激励信号的频率来进行测试,实现快速检测待测元件的具体参数信息。

    一种鲁棒的分布式说话人噪声消除系统

    公开(公告)号:CN114724571A

    公开(公告)日:2022-07-08

    申请号:CN202210329198.2

    申请日:2022-03-29

    Abstract: 本发明公开了一种鲁棒的分布式说话人噪声消除系统,包括离散傅里叶变换模块、语音活动检测模块、信噪比计算模块、树形拓扑修剪模块、数据驱动比较模块、数据压缩模块、根节点运算模块、协方差矩阵估计模块、滤波器更新模块、结果传递模块、根节点更新模块和离散傅里叶反变换模块。本发明是一种可以应用在任意网络拓扑连接下的鲁棒分布式说话人噪声消除技术,它通过将任意网络拓扑修剪为树形拓扑,并在树形拓扑下完成了输入信噪比的比较,这使得对于运动说话人具有一定的鲁棒性,即无论说话人的位置在哪里,拥有最大输入信噪比的节点总是可以被找到,最终进行分布式说话人噪声消除。

    一种基于G.722.1的多描述语音编码方法

    公开(公告)号:CN111402907A

    公开(公告)日:2020-07-10

    申请号:CN202010177908.5

    申请日:2020-03-13

    Abstract: 本发明公开了一种基于G.722.1的多描述语音编码方法,将原始语音信号分别输入至G.722.1编码器和互补编码器进行编码分别得到码流I和码流II;将码流I和码流II分别打包成packet1和packet2,再将packet1和packet2通过通信网络传输至解码器中进行解码得到解码语音信号。该方法采用一种多描述语音编码框架,将一条语音编码出两个码流,这两个码流互不影响,可以使用原解码器单独解码,且解码出的语音质量不低于原G.722.1编解码器;如果两个码流联合解码,解码出的语音质量明显优于原G.722.1编解码器,并且新引入的互补编码器,编码时采用不断量化、反馈感知误差的方法。

Patent Agency Ranking