-
公开(公告)号:CN118972716B
公开(公告)日:2025-01-10
申请号:CN202411453172.4
申请日:2024-10-17
Applicant: 深圳波洛斯科技有限公司
IPC: H04Q5/24 , G10L15/22 , G10L15/26 , G10L17/02 , G10L17/08 , G10L21/0232 , G16H80/00 , G06F40/216 , G06F40/295 , G06F40/30
Abstract: 本发明涉及医疗语音通信技术领域,公开了一种基于音频处理的医疗对讲系统及方法,该系统包括:音频采集模块、音频定位模块、需求确定模块、指令生成模块、指令分配模块、响应人员确定模块、指令发送模块和响应处理模块。通过实施本发明,以智能语音识别和语义分析技术自动解析呼叫音频中的需求类型数据和紧急等级,实现资源的精准分配和优先处理,确保关键需求得到及时响应,精准定位患者位置并识别患者需求,迅速匹配到最合适的响应团队。
-
公开(公告)号:CN118972868B
公开(公告)日:2024-12-13
申请号:CN202411453166.9
申请日:2024-10-17
Applicant: 深圳波洛斯科技有限公司
IPC: H04W16/20 , H04B17/318 , H04B17/391
Abstract: 本发明提供了一种基于AES音频处理技术的无线传输方法,涉及无线传输技术领域,所述方法包括:确定无线信号从目标厂房的发射端到接收端的无线信号衰减率;获取每一种摆放形态的物体对应的无线信号衰减率,结合不摆放物体时每一预设环境因素对应的无线信号衰减率,确定受不同摆放形态的物体影响的无线信号衰减率;确定发射端在当前的环境因素以及物体摆放形态下对应的最佳的目标发射功率;本发明能够在确保音频信号无线传输稳定性的前提下,自适应的确定发射端的无线信号发射功率,避免发射端的发射功率一直处于最大发射功率的状态,进而延缓无线信号发射设备的老化,增加无线信号发射设备的使用寿命。
-
公开(公告)号:CN118963603A
公开(公告)日:2024-11-15
申请号:CN202411453164.X
申请日:2024-10-17
Applicant: 深圳波洛斯科技有限公司
IPC: G06F3/0481 , G06N3/0464 , G06N3/08 , G10L15/20 , G10L15/22 , G10L21/0208 , G10L25/30
Abstract: 本发明涉及智能面板技术领域,公开了一种基于DNN降噪技术的智能面板控制方法,包括:利用预训练的第一卷积神经网络模型对语音交互数据进行降噪处理,得到降噪语音交互数据;对图像交互数据和降噪语音交互数据进行分析,得到用户指令数据;基于用户指令数据和情境标签对待控智能面板的显示内容数据和界面布局数据进行调整;基于调整后的显示内容数据和调整后的界面布局数据控制待控智能面板显示交互界面。通过实施本发明,融合多源数据,包括图像、语音、环境数据和人员行为数据,使得智能面板能够更精准地响应用户的操作,解决智能面板控制方法在数据处理和情境适应性等方面存在明显不足,难以满足现代医院对智能化管理与控制的高要求的问题。
-
公开(公告)号:CN118042329B
公开(公告)日:2024-07-02
申请号:CN202410430687.6
申请日:2024-04-11
Applicant: 深圳波洛斯科技有限公司
Abstract: 本申请公开了一种基于会议场景的多麦克风阵列降噪方法及系统,应用于配置有多麦克风阵列、麦克风降噪系统的终端,方法包括:在开始会议前,通过预设的校准界面获取与会者的脸部图像在终端屏幕中的标准比值;会议开始时,实时采集视频图像,并对视频图像进行实时人脸检测,得到与会者的脸部图像;根据视频图像中的脸部图像,确定与会者的声源方向,并增强麦克风降噪系统对声源方向上声音信号的敏感度;根据预设的算法计算得到脸部图像与视频图像大小的目标比值;将目标比值与标准比值进行比对,确定麦克风降噪系统的工作模式。由此,能够利用视频图像中与会者脸部图像的比值,准确进行麦克风降噪系统的工作模式的切换,提高降噪效果和通话质量。
-
公开(公告)号:CN117877517B
公开(公告)日:2024-05-24
申请号:CN202410264949.6
申请日:2024-03-08
Applicant: 深圳波洛斯科技有限公司
Abstract: 本发明涉及数据处理技术领域,公开了基于对抗神经网络的环境音生成方法、装置、设备及介质,该方法包括:获取第i次环境音、第一描述信息、第二描述信息;利用第一判别器对第i次环境音进行评估得到第一评估结果,利用第二判别器对第i次环境音进行评估得到第二评估结果,利用自适应调整器调整生成器的参数;利用调参后的生成器基于生成第i+1次环境音;当第i+1次为预设的迭代次数时,输出第i+1次环境音为目标环境音。通过实施本发明,避免了相关技术中生成的环境音难以满足创作的情境要求和情感要求的问题,确保生成的环境音在情景和情感方面都更加接近目标,提高了音频生成的准确性和质量。
-
公开(公告)号:CN117275499B
公开(公告)日:2024-02-02
申请号:CN202311533329.X
申请日:2023-11-17
Applicant: 深圳波洛斯科技有限公司
Abstract: 本申请提供了一种自适应神经网络的降噪方法及相关装置,方法包括:确定目标神经网络降噪模型上一时间步的第一模型误差和当前时间步的第二模型误差;确定模型误差变化值;若检测出模型误差变化值大于第一预设阈值,且模型误差变化值为正值,则确定第一层数调整公式;将模型误差变化值带入第一层数调整公式,得到目标神经网络降噪模型所需增加的神经网络层的第一数量;控制目标神经网络降噪模型以第一速率增加第一数量的神经网络层。采用本申请实施例能够实现实时根据噪声环境和语音信号的复杂性,在每次降噪操作中动态调整目标神经网络降噪模型的神经网络的层数,有利于提高降噪性能。
-
公开(公告)号:CN117275499A
公开(公告)日:2023-12-22
申请号:CN202311533329.X
申请日:2023-11-17
Applicant: 深圳波洛斯科技有限公司
Abstract: 本申请提供了一种自适应神经网络的降噪方法及相关装置,方法包括:确定目标神经网络降噪模型上一时间步的第一模型误差和当前时间步的第二模型误差;确定模型误差变化值;若检测出模型误差变化值大于第一预设阈值,且模型误差变化值为正值,则确定第一层数调整公式;将模型误差变化值带入第一层数调整公式,得到目标神经网络降噪模型所需增加的神经网络层的第一数量;控制目标神经网络降噪模型以第一速率增加第一数量的神经网络层。采用本申请实施例能够实现实时根据噪声环境和语音信号的复杂性,在每次降噪操作中动态调整目标神经网络降噪模型的神经网络的层数,有利于提高降噪性能。
-
公开(公告)号:CN117079634A
公开(公告)日:2023-11-17
申请号:CN202311332015.3
申请日:2023-10-16
Applicant: 深圳波洛斯科技有限公司
IPC: G10K11/178 , G10L25/30
Abstract: 本发明公开了一种音频主动降噪方法,涉及主动降噪技术领域,依据音频段的噪声特征,从预先构建的滤波器库中匹配出对应的滤波器,以其分别对各个音频段进行过滤并获取滤后音频,通过测试结果筛选出降噪效果最佳的降噪方案;由降噪后音频的降噪结果建立降噪质量集合,由所述降噪质量集合生成降噪后音频的噪声指数No(n,d)后,若其低于质量阈值,向外部发出预警信息;训练获取瑕疵音频段的噪声模型,对瑕疵音频段的降噪过程进行仿真测试,获取测试方案的修正方案,以修正方案对瑕疵音频段进行降噪,获取降噪后音频。对瑕疵音频进行降噪时针对性更强,提高降噪的效果,使经过一次滤波和两次降噪的音频质量达到最高。
-
公开(公告)号:CN113436636A
公开(公告)日:2021-09-24
申请号:CN202110654926.2
申请日:2021-06-11
Applicant: 深圳波洛斯科技有限公司
Inventor: 胡程远
IPC: G10L21/0208 , G10L21/0216 , G10L25/30
Abstract: 本发明实施例公开了一种基于自适应滤波器和神经网络的声学回声消除方法及其系统。方法包括:获取待处理的语音信号;所述待处理的语音信号包括远端语音和近端麦克风语音;将所述待处理的语音信号输入自适应滤波器进行处理,得到残留信号;采用神经网络对所述残留信号进行进行二次处理,以消除所述残留信号中的非线性部分,得到回声消除后的近场音频信号。实施本发明的方法及其系统,针对声学回声,采用自适应滤波器+神经网络的方式,对自适应滤波器输出的残留信号进行二次处理,消除其中的非线性部分,可以得到清晰的回声消除后的近场音频信号,从而解决了传统回声消除方法所存在的技术问题。
-
公开(公告)号:CN119028309B
公开(公告)日:2025-02-14
申请号:CN202411453169.2
申请日:2024-10-17
Applicant: 深圳波洛斯科技有限公司
IPC: G10K11/178 , G10L15/20 , G10L15/24 , G10L15/26
Abstract: 本发明提供了一种基于DNN降噪技术的车载多音区系统,涉及车载多音区系统技术领域,所述新系统包括:获取目标车辆的屏蔽区域内的初始音频,使用预设的DNN降噪模型对初始音频进行降噪,以得到初始用户语音;提取初始用户语音中的每一关键词,进而根据初始用户语音中的每一关键词以及初始用户语音对应的用户在车内所坐的座位,以及该座位对应的区域的图像,并结合后排区域用户的数量,确定初始用户语音是否为目标用户语音;将目标用户语音通过设置于主驾区域的音频设备进行播放;本发明能够在不关闭屏蔽功能的前提下,有针对性的将用户说给司机的语音通过音频设备播放给司机,从而简化用户语音沟通的过程,提高车内驾乘人员语音沟通的效率。
-
-
-
-
-
-
-
-
-