-
公开(公告)号:CN111192291B
公开(公告)日:2022-11-11
申请号:CN201911242648.9
申请日:2019-12-06
Applicant: 东南大学 , 南京南大电子智慧型服务机器人研究院有限公司 , 江苏南大电子信息技术股份有限公司
Abstract: 本发明公开了一种基于级联回归与孪生网络的目标跟踪方法,在第一帧,将指定的目标图像及以目标图像为中心构建的搜索区域分别输入以孪生网络构成的特征提取网络,分别得到目标图像与搜索区域的特征图。将得到的不同层次的特征图按设计的Attention机制融合,并一同输入到后续的级联区域推荐网络之中。经过级联区域推荐网络之后得到各个锚框的分类及位置预测信息,并得到锚框的预测得分图。通过非极大值抑制以及添加余弦窗等操作筛选出得分最高的锚框,并根据回归的得到的位置信息得到最终的预测框。本发明与传统算法相比上述算法具有精度高,鲁棒性强以及运行效率高的优点。
-
公开(公告)号:CN113707133A
公开(公告)日:2021-11-26
申请号:CN202111258859.9
申请日:2021-10-28
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学 , 江苏南大电子信息技术股份有限公司
Abstract: 本发明公开了一种基于声环境感知的服务机器人语音输出增益获取方法,首先确定语言可懂度指标,然后测量单位幅度信号驱动时,机器人发声系统在目标位置处产生的语声级零敏度SS;获取服务机器人工作场所的混响时间T60;使用机器人自身的传声器获取所在场景的背景噪声级NL;根据语言可懂度指标、混响时间T60、语音背景噪声级NL代入语言可懂度预测模型得到目标位置的期望语声级SPL;根据语声级零敏度SS和期望语声级SPL实时得到语音输出增益。本发明在机器人所处复杂声环境中时可考虑反射声和背景噪声的影响,有效提升机器人发声时的语音可懂度,并降低对周边环境的影响。
-
公开(公告)号:CN113421541B
公开(公告)日:2021-10-29
申请号:CN202110964906.5
申请日:2021-08-23
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 江苏南大电子信息技术股份有限公司 , 南京敏嘉数据科技有限公司
IPC: G10K11/178
Abstract: 本发明公开了一种基于系数平滑的频域有源噪声控制系统,包括依次连接的后端控制滤波器、系数平滑器、前端控制滤波器,所述系数平滑器根据得到的后端控制滤波器时域系数对前端控制滤波器时域系数进行平滑,并更新前端控制滤波器,限制因系数变化过大带来的系统杂音,进而提高有源噪声控制系统的稳定性和有效性。本发明解决了使用频域算法的有源噪声控制系统出现的杂音问题。
-
公开(公告)号:CN112269158A
公开(公告)日:2021-01-26
申请号:CN202011096574.5
申请日:2020-10-14
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学 , 江苏南大电子信息技术股份有限公司
Abstract: 本发明公开了一种基于UNET结构利用传声器阵列语音源定位方法,步骤如下:(1)生成训练样本,得到时‑频域信号,并获得功率包络;(2)对时‑频域信号的每个时‑频点,计算对应的语音能量占比和直达路径语音能量占比;(3)利用步骤(1)生成的样本训练多任务UNET结构的神经网络;(4)利用已训练的多任务UNET结构的神经网络预测待测含噪信号每个时‑频点语音直达声能量占比;(5)对判断语音直达声能量占比较高的时‑频点,应用定位方法,得到定位结果。本发明的语音声源定位方法,能够使得在高混响及高干扰的环境中,有效去除干扰和混响的影响,获得精确度和鲁棒性较高的结果。
-
公开(公告)号:CN112233641A
公开(公告)日:2021-01-15
申请号:CN202011095926.5
申请日:2020-10-14
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学 , 江苏南大电子信息技术股份有限公司
IPC: G10K11/178
Abstract: 本发明公开了一种提升分散式有源噪声控制系统稳定性的方法,对分散式有源噪声控制系统建立集中式的次级路径频域传递函数Z和分散式的次级路径ZeH频Z域矩传阵特递征函值数复Ze平;在面上搜索最小旋转相位差,计算能使系统稳定的相位修正角度θ,根据相的位相位修,正进角而度影θ响调Z整eHZZ矩e阵特征值相位,使其特征值实部都大于0,获得稳定的系统。本发明能够提升线形排列并均匀分布的分散式有源噪声控制系统稳定性,且不影响系统的降噪性能,对于通道数很多的系统,仅需要少量通道来计算相位修正角度,所得相位修正角度对所有通道均适用,简单易行。
-
公开(公告)号:CN109697990B
公开(公告)日:2020-12-11
申请号:CN201811341603.2
申请日:2018-11-12
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学 , 江苏南大电子信息技术股份有限公司
IPC: G10L25/60
Abstract: 本发明公开了一种基于虚拟低音算法主观评价的客观评价方法,将语义细分法和系统范畴法这两种常用的主观评价方法进行了结合,利用多元线性回归分析在PEAQ中BV版本的11个模型输出参量MOVs以及PEAQ的两个输出值ODG、DI和音频频谱重心ASC基础上提出。本发明性能好,能准确地评价虚拟低音算法效果的好坏。
-
公开(公告)号:CN110534119B
公开(公告)日:2020-07-03
申请号:CN201911034162.6
申请日:2019-10-29
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 江苏南大电子信息技术股份有限公司
IPC: G10L19/00 , G10L19/02 , G10L19/032 , G10L25/27
Abstract: 本发明公开了一种基于人耳听觉频率尺度信号分解的音频编解码方法,为了较好的使用心理声学模型,将线性频域的处理结果折算到对应的人耳听觉频率尺度(Bark)上,用以控制线性频域参数的量化误差。直接在人耳听觉频率尺度上进行信号分解,实现时域信号在Bark尺度的投影计算,本发明采用基于人耳听觉频率尺度进行音频信号的非均匀子带分解,有效的利用人耳听觉的心理声学模型,提升了心理声学模型计算精度和编解码的效率,本发明的量化对象为子带时域信号,在满足音频编解码码率的前提下将编解码量化失真控制在心理声学模型的参数允许范围内,量化方式新颖且效率高。
-
公开(公告)号:CN111309004A
公开(公告)日:2020-06-19
申请号:CN201911238521.X
申请日:2019-12-06
Applicant: 江苏南大电子信息技术股份有限公司
IPC: G05D1/02
Abstract: 本发明公开了一种基于改进的跳点搜索算法移动机器人路径规划方法,先从正方向进行节点扩展,对于直线方向和对角线方向,按规则裁剪掉所有符合条件的节点,对扩展节点的邻节点进行裁剪后,寻找强制邻节点,并根据强制邻节点位置找到跳点,正方向搜索到跳点后,切换为反方向搜索,直到正反方向搜索到的跳点出现重合时,说明此时发现一条完整路径,本发明机器人在路径规划时,从起始点和目标点两个方向利用跳点搜索算法同时进行路径搜索,在路径规划时,减少了算法运行过程中计算的节点,路径规划时间大大减少,内存消耗降低,因此机器人的寻路效率大大提高,其有效减少机器人寻路时间,提高机器人寻路效率。
-
公开(公告)号:CN111177804A
公开(公告)日:2020-05-19
申请号:CN201811341634.8
申请日:2018-11-13
Applicant: 江苏南大电子信息技术股份有限公司 , 马鞍山艾德声电子技术有限公司 , 南京南大电子智慧型服务机器人研究院有限公司
Inventor: 狄敏
IPC: G06F21/74
Abstract: 本发明公开了一种基于多平台数据安全隔离与业务协同工作的系统及方法,包括智能单元、业务单元、切换板以及显示触摸屏,所述智能单元与业务单元之间通过两个I/O口连接,通过高低电平的方式,相互传递各自的切换控制及状态反馈,并最终由智能单元和/或业务单元判定是否发送切换命令。采用多块处理板分别处理人工智能相关数据和业务办理数据,多块处理板利用切换板连接至同一块显示触摸屏,进而实现人工智能数据和业务办理数据在硬件电路上相互隔离。在数据安全和功能性方面,本发明实现平台之间的协同化,在平台建设及维护方面,本发明可解决私有化部署带来的平台建设、维护费用,更利于平台的自我升级。
-
公开(公告)号:CN110717299A
公开(公告)日:2020-01-21
申请号:CN201910985941.8
申请日:2019-10-17
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 江苏南大电子信息技术股份有限公司
Abstract: 本发明公开了一种基于形体设计的机器人发声系统优化方法,包括以下步骤:首先确定机器人形体的最大尺寸、内部所需空间大小,扬声器安装位置和目标位置;然后优化在机器人上待抠除区域的几何参数:以扬声器安装位置和目标位置为椭圆的两个焦点,扬声器和目标位置的连线为长轴所在直线,根据内部所需空间形状的条件下,从0开始逐渐增大椭圆的短轴尺寸,将椭圆绕长轴旋转一周形成椭圆,椭圆与机器人的重合区域为待抠除区域,以待抠除区域接近内部所需空间的最小值为优化目标,确定椭圆的长轴和短轴;最后在机器人形体加工时抠除待抠除区域。本发明能够提高目标区域的声压级,能够改善人机交互的听音体验。
-
-
-
-
-
-
-
-
-