一种基于麦克风阵列与双目摄像头的说话人定位与识别方法

    公开(公告)号:CN108734733B

    公开(公告)日:2022-04-26

    申请号:CN201810473571.5

    申请日:2018-05-17

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于麦克风阵列与双目摄像头的说话人定位与识别方法,主要依托麦克风阵列和占用资源较少的TDOA方法进行说话人粗定位,之后再结合精度更高但是视野狭小的双目摄像头进行准确定位,在实现了精准的360°全方位声源定位的基础上大幅减少了软件开销,使得系统能够获得更高的刷新率,或者在空闲时间内执行其他任务;同时,本发明还利用了动态调整的加权平均方法来权衡声音和图像的识别结果使得最终系统输出的识别结果更为准确可靠。

    一种基于麦克风阵列与双目摄像头的说话人定位与识别方法

    公开(公告)号:CN108734733A

    公开(公告)日:2018-11-02

    申请号:CN201810473571.5

    申请日:2018-05-17

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于麦克风阵列与双目摄像头的说话人定位与识别方法,主要依托麦克风阵列和占用资源较少的TDOA方法进行说话人粗定位,之后再结合精度更高但是视野狭小的双目摄像头进行准确定位,在实现了精准的360°全方位声源定位的基础上大幅减少了软件开销,使得系统能够获得更高的刷新率,或者在空闲时间内执行其他任务;同时,本发明还利用了动态调整的加权平均方法来权衡声音和图像的识别结果使得最终系统输出的识别结果更为准确可靠。

Patent Agency Ranking