Patent search ap:("清华大学") AND inv:"龚培彬" Page 1

1.

发明授权
视频数据处理方法、装置及设备有权

公开(公告)号：CN114067237B

公开(公告)日：2025-05-13

申请号：CN202111264126.6

申请日：2021-10-28

Applicant: 清华大学

Inventor： 龚培彬 , 杨毅 , 孙甲松

IPC: G06V20/40 , G06V30/148 , G06V10/82 , G06N3/0464

Abstract: 本申请提供一种视频数据处理方法、装置及设备，涉及计算机技术，该方法包括：获取待检测视频，待检测视频内包括多个文本；根据预设的文本检测模型检测待检测视频内的文本，其中，文本检测模型为根据注意力机制及预设的形状感知的损失函数对神经网络模型训练得到的；根据检测到的文本，输出包含文本检测框的视频，文本检测框用于标示文本在视频内的位置。本申请的方法，可以解决文本检测中准确率与速度无法同时兼顾的问题，在实现高准确率的文本检测的同时，大大提升了文本检测的速度，更加的适应实际应用，解决了检测文本的效率较低的技术问题。

2.

发明公开
视频数据处理方法、装置及设备有权

公开(公告)号：CN114067237A

公开(公告)日：2022-02-18

申请号：CN202111264126.6

申请日：2021-10-28

Applicant: 清华大学

Inventor： 龚培彬 , 杨毅 , 孙甲松

IPC: G06V20/40 , G06V30/148 , G06N3/04 , G06N3/08

Abstract: 本申请提供一种视频数据处理方法、装置及设备，涉及计算机技术，该方法包括：获取待检测视频，待检测视频内包括多个文本；根据预设的文本检测模型检测待检测视频内的文本，其中，文本检测模型为根据注意力机制及预设的形状感知的损失函数对神经网络模型训练得到的；根据检测到的文本，输出包含文本检测框的视频，文本检测框用于标示文本在视频内的位置。本申请的方法，可以解决文本检测中准确率与速度无法同时兼顾的问题，在实现高准确率的文本检测的同时，大大提升了文本检测的速度，更加的适应实际应用，解决了检测文本的效率较低的技术问题。

Patent Agency Ranking