-
公开(公告)号:CN114067237B
公开(公告)日:2025-05-13
申请号:CN202111264126.6
申请日:2021-10-28
Applicant: 清华大学
IPC: G06V20/40 , G06V30/148 , G06V10/82 , G06N3/0464
Abstract: 本申请提供一种视频数据处理方法、装置及设备,涉及计算机技术,该方法包括:获取待检测视频,待检测视频内包括多个文本;根据预设的文本检测模型检测待检测视频内的文本,其中,文本检测模型为根据注意力机制及预设的形状感知的损失函数对神经网络模型训练得到的;根据检测到的文本,输出包含文本检测框的视频,文本检测框用于标示文本在视频内的位置。本申请的方法,可以解决文本检测中准确率与速度无法同时兼顾的问题,在实现高准确率的文本检测的同时,大大提升了文本检测的速度,更加的适应实际应用,解决了检测文本的效率较低的技术问题。
-
公开(公告)号:CN114067237A
公开(公告)日:2022-02-18
申请号:CN202111264126.6
申请日:2021-10-28
Applicant: 清华大学
IPC: G06V20/40 , G06V30/148 , G06N3/04 , G06N3/08
Abstract: 本申请提供一种视频数据处理方法、装置及设备,涉及计算机技术,该方法包括:获取待检测视频,待检测视频内包括多个文本;根据预设的文本检测模型检测待检测视频内的文本,其中,文本检测模型为根据注意力机制及预设的形状感知的损失函数对神经网络模型训练得到的;根据检测到的文本,输出包含文本检测框的视频,文本检测框用于标示文本在视频内的位置。本申请的方法,可以解决文本检测中准确率与速度无法同时兼顾的问题,在实现高准确率的文本检测的同时,大大提升了文本检测的速度,更加的适应实际应用,解决了检测文本的效率较低的技术问题。
-