用于视频中文本区域检测与定位的方法

    公开(公告)号:CN102542268B

    公开(公告)日:2014-04-23

    申请号:CN201110451826.6

    申请日:2011-12-29

    Inventor: 刘成林 白博 殷飞

    Abstract: 一种用于视频中文本区域检测与定位的方法,其特征在于,包含如下步骤:输入视频,按等时间间隔对输入视频进行采样;对采样得到的图像进行边缘检测;利用检测后得到的图像生成文本置信度图;根据生成的文本置信度图提取文本候选区域;对文本候选区域近似相同的多帧图像的文本候选区域进行融合;对融合后的文本区域图像进行分行。本发明的文本检测与定位方法能够实时地对视频中出现的多语言文本进行准确定位。可以适用于视频内容编辑、索引与检索等多种用途。

    一种视频字幕文本提取和识别的方法

    公开(公告)号:CN102332096B

    公开(公告)日:2013-01-02

    申请号:CN201110315054.3

    申请日:2011-10-17

    Inventor: 刘成林 白博 殷飞

    Abstract: 本发明公开了一种视频字幕文本提取和识别的方法,其步骤包括:输入视频中字幕区域的图像;将输入图像转化为灰度图;判断字幕区域中字符排列的方向;将竖直排列的字幕区域逆时针旋转90°得到水平字幕区域;对字幕区域进行分行得到单行字幕图像;对单行字幕区域图像自动判断前景颜色,得到单行字幕二值图像;对单行字幕二值图像进行过切分得到字符片段序列;对过切分后的单行字幕二值图像进行文本行识别。本方法能有效分割水平和竖直的视频字幕文本行,准确判断字符前景颜色并滤除噪声,并得到准确的字符切分与识别结果,可以适用于视频和图像内容编辑、索引与检索等多种用途。

    一种视频字幕文本提取和识别的方法

    公开(公告)号:CN102332096A

    公开(公告)日:2012-01-25

    申请号:CN201110315054.3

    申请日:2011-10-17

    Inventor: 刘成林 白博 殷飞

    Abstract: 本发明公开了一种视频字幕文本提取和识别的方法,其步骤包括:输入视频中字幕区域的图像;将输入图像转化为灰度图;判断字幕区域中字符排列的方向;将竖直排列的字幕区域逆时针旋转90°得到水平字幕区域;对字幕区域进行分行得到单行字幕图像;对单行字幕区域图像自动判断前景颜色,得到单行字幕二值图像;对单行字幕二值图像进行过切分得到字符片段序列;对过切分后的单行字幕二值图像进行文本行识别。本方法能有效分割水平和竖直的视频字幕文本行,准确判断字符前景颜色并滤除噪声,并得到准确的字符切分与识别结果,可以适用于视频和图像内容编辑、索引与检索等多种用途。

    可携带文档格式文档图文对的提取方法及装置

    公开(公告)号:CN118885443B

    公开(公告)日:2024-12-27

    申请号:CN202411357179.6

    申请日:2024-09-27

    Inventor: 李晓辉 刘成林

    Abstract: 本发明提供一种PDF文档图文对的提取方法、装置、设备及存储介质,属于数据处理技术领域,其方法包括:对目标PDF文档进行解析,得到文本块数据和文本块数据对应的文本坐标,将目标PDF文档逐页转换成文档图像;对文本块数据进行筛选去重处理,获取候选图例文本,并确定候选图例文本对应的候选图例文本坐标,基于图像处理技术对文档图像进行处理,提取候选插图区域;基于候选图例文本坐标,对候选图例文本和候选插图区域进行匹配,过滤匹配失败的候选图例文本和匹配失败的候选插图区域,合并属于同一图例的候选插图区域,得到目标PDF文档的图文对匹配结果。从而精准识别并提取PDF文档中的图文对,操作流程简单、硬件资源开销低。

    基于深度学习的印章图像真伪鉴别方法及装置

    公开(公告)号:CN117765561B

    公开(公告)日:2024-10-29

    申请号:CN202311547095.4

    申请日:2023-11-16

    Abstract: 本发明提供一种基于深度学习的印章图像真伪鉴别方法及装置,所述方法包括:获取待鉴别印章图像和对应的参照图像,参照图像为真印章图像;将待鉴别印章图像和参照图像进行图像配准对齐;通过基于Siamese的特征提取神经网络,对图像配准对齐后的待鉴别印章图像和参照图像进行特征提取,得到待鉴别印章图像的深度学习特征和参照图像的深度学习特征,基于Siamese的特征提取神经网络包括至少两个通过SE‑Block结构在中间层相互连接的特征提取子网络,特征提取子网络的网络结构为DenseNet结构;基于待鉴别印章图像的深度学习特征和所述参照图像的深度学习特征,进行相似性度量后鉴别所述待鉴别印章图像的真伪。

    基于前景子空间的开放集目标检测方法和装置

    公开(公告)号:CN116229159B

    公开(公告)日:2024-09-03

    申请号:CN202310109841.5

    申请日:2023-02-02

    Abstract: 本申请公开了一种基于前景子空间的开放集目标检测方法和装置,涉及计算机技术领域,其中方法包括:获取待检测图像;将所述待检测图像输入至目标检测模型,得到所述目标检测模型输出的所述待检测图像对应的前景目标的预测位置和预测类别;所述目标检测模型用于基于所述待检测图像中候选目标的图像特征与前景子空间之间的距离确定所述前景目标,并基于所述前景目标与已知类别对应的原型在所述前景子空间中的投影坐标之间的距离确定所述前景目标的预测类别;所述前景子空间是基于所述已知类别对应的原型特征构建的。本申请提供的方法和装置,提高了前景目标检测的准确性。

    基于前景子空间的开放集目标检测方法和装置

    公开(公告)号:CN116229159A

    公开(公告)日:2023-06-06

    申请号:CN202310109841.5

    申请日:2023-02-02

    Abstract: 本申请公开了一种基于前景子空间的开放集目标检测方法和装置,涉及计算机技术领域,其中方法包括:获取待检测图像;将所述待检测图像输入至目标检测模型,得到所述目标检测模型输出的所述待检测图像对应的前景目标的预测位置和预测类别;所述目标检测模型用于基于所述待检测图像中候选目标的图像特征与前景子空间之间的距离确定所述前景目标,并基于所述前景目标与已知类别对应的原型在所述前景子空间中的投影坐标之间的距离确定所述前景目标的预测类别;所述前景子空间是基于所述已知类别对应的原型特征构建的。本申请提供的方法和装置,提高了前景目标检测的准确性。

    一种空中手写字符串识别方法

    公开(公告)号:CN103577843A

    公开(公告)日:2014-02-12

    申请号:CN201310597539.5

    申请日:2013-11-22

    Abstract: 本发明公开了一种空中手写字符串识别系统和方法。该系统包括:手势识别模块,与手指轨迹提取模块连接,用于识别标识开始书写和结束书写的手势;手指轨迹提取模块,与预处理模块连接,用于对输入的手写动作进行手指轨迹的提取和记录;预处理模块,与空中手写字符串识别模块连接,用于对手指轨迹数据进行预处理;字符串识别模块,与预处理模块连接,用于对手指轨迹数据进行字符串识别。本发明还公开了一种空中手写字符串识别方法。本发明支持的书写方式新颖便捷,识别准确迅速,为人们在传统手写方式之外提供了一种更加人性化和智能化的手写输入方式,可广泛适用于人机交互系统中,如游戏操作、电视控制、教学系统等。

Patent Agency Ranking