Patent search ap:("东南大学") AND inv:"李英昊" Page 1

1.

发明授权
一种基于麦克风阵列与双目摄像头的说话人定位与识别方法有权

公开(公告)号：CN108734733B

公开(公告)日：2022-04-26

申请号：CN201810473571.5

申请日：2018-05-17

Applicant: 东南大学

Inventor： 莫凌飞 , 李英昊 , 厉叶

IPC: G06T7/70 , G06V40/16 , G01S5/22 , G10L17/04 , G06N3/04

Abstract: 本发明公开了一种基于麦克风阵列与双目摄像头的说话人定位与识别方法，主要依托麦克风阵列和占用资源较少的TDOA方法进行说话人粗定位，之后再结合精度更高但是视野狭小的双目摄像头进行准确定位，在实现了精准的360°全方位声源定位的基础上大幅减少了软件开销，使得系统能够获得更高的刷新率，或者在空闲时间内执行其他任务；同时，本发明还利用了动态调整的加权平均方法来权衡声音和图像的识别结果使得最终系统输出的识别结果更为准确可靠。

2.

发明公开
一种基于麦克风阵列与双目摄像头的说话人定位与识别方法有权

公开(公告)号：CN108734733A

公开(公告)日：2018-11-02

申请号：CN201810473571.5

申请日：2018-05-17

Applicant: 东南大学

Inventor： 莫凌飞 , 李英昊 , 厉叶

IPC: G06T7/70 , G06K9/00 , G01S5/22 , G10L17/04 , G06N3/04

Abstract: 本发明公开了一种基于麦克风阵列与双目摄像头的说话人定位与识别方法，主要依托麦克风阵列和占用资源较少的TDOA方法进行说话人粗定位，之后再结合精度更高但是视野狭小的双目摄像头进行准确定位，在实现了精准的360°全方位声源定位的基础上大幅减少了软件开销，使得系统能够获得更高的刷新率，或者在空闲时间内执行其他任务；同时，本发明还利用了动态调整的加权平均方法来权衡声音和图像的识别结果使得最终系统输出的识别结果更为准确可靠。

Patent Agency Ranking