文本检测模型的训练方法、文本检测方法及装置

    公开(公告)号:CN113128485B

    公开(公告)日:2025-02-14

    申请号:CN202110285620.4

    申请日:2021-03-17

    Inventor: 吴翔宇 袁玮

    Abstract: 本公开关于一种文本检测模型的训练方法、文本检测方法及装置,该文本检测模型的训练方法包括:获取目标样本图像集,该目标样本图像集包括具有文本框标签的目标样本图像;对目标样本图像进行旋转,得到旋转后的目标样本图像;确定旋转后的目标样本图像中的文本框的目标位置信息;基于旋转后的目标样本图像和该目标位置信息,对神经网络进行文本检测训练,得到目标样本图像对应的文本预测结果;根据文本预测结果和文本框标签,确定损失数据;基于损失数据训练上述神经网络,得到文本检测模型。利用本公开实施例提供的技术方案不仅可以对常见自然场景中的文本识别保持较高的精度,还可以确保对竖排文本检测的较高准确率和召回率。

    二维码处理方法、装置、电子设备及存储介质

    公开(公告)号:CN110991457A

    公开(公告)日:2020-04-10

    申请号:CN201911175822.2

    申请日:2019-11-26

    Inventor: 吴翔宇 杨帆 袁玮

    Abstract: 本公开关于一种二维码处理方法、装置、电子设备及存储介质,属于图像处理领域。本公开提供的方案,通过将获取到的二维码图像输入至二维码处理模型,通过二维码处理模型,对二维码图像进行卷积处理,得到该二维码图像的第一图像特征,对该第一图像特征进行反卷积处理,得到第二图像特征,基于目标阈值对该第二图像特征进行映射,输出该二维码图像的二值化图像,通过二维码处理模型对图像特征进行提取,可以实现对二维码图像中的阴影或颜色渐变等无用特征的处理,强化二维码图像中的有用特征,从而可以在弱光、强光、低对比度等场景下获取到的图像不够清晰时,也能够实现二维码的识别,提高识别成功率。

    页面交互方法、装置、电子设备及存储介质

    公开(公告)号:CN115186170A

    公开(公告)日:2022-10-14

    申请号:CN202210524231.7

    申请日:2022-05-13

    Abstract: 本公开关于一种页面交互方法、装置、电子设备及存储介质,该方法包括响应于目标对象触发的媒体信息查看指令,在预设页面展示目标媒体信息;在目标媒体信息展示过程中,监测用于指示目标对象执行目标交互操作情况的操作执行状态;在到达目标激励时间且未监测到目标对象执行目标交互操作的情况下,将目标交互激励信息展示在预设页面;其中,目标交互激励信息为多个预设激励时间对应的多种交互激励信息中与目标激励时间对应的交互激励信息;多种交互激励信息用于以不同的展示样式,指示目标对象通过执行目标交互操作获得操作激励资源。利用本公开实施例可以有效丰富页面样式,实现交互激励信息的动态展示,大大提升了页面的交互性。

    二维码图像关键点检测方法、装置、电子设备及存储介质

    公开(公告)号:CN111104813A

    公开(公告)日:2020-05-05

    申请号:CN201911299984.7

    申请日:2019-12-16

    Inventor: 吴翔宇 杨帆 袁玮

    Abstract: 本公开关于一种二维码图像关键点检测方法、装置、电子设备及存储介质。二维码图像关键点检测方法包括:对于待检测的包含二维码的图像,将该图像输入已训练的关键点检测模型;根据所述关键点检测模型输出的检测结果,得到所述图像中二维码的关键点坐标;由于本公开采用的关键点检测模型的训练图像样本中包含由对包含二维码的原始图像进行裁剪、扩充、旋转得到的至少两种图像样本。由这些训练图像样本训练得到的关键点检测模型,能够有效识别不同尺寸、不同图像质量和/或不同拍摄角度的二维码的关键点。本公开提供的技术方案能够准确识别出图像中二维码的关键点的坐标,检测准确性高。

    视频搜索方法、装置、计算机设备及存储介质

    公开(公告)号:CN112364204B

    公开(公告)日:2024-03-12

    申请号:CN202011264524.3

    申请日:2020-11-12

    Inventor: 吴翔宇 袁玮

    Abstract: 本公开关于一种视频搜索方法、装置、计算机设备及存储介质,属于计算机领域。本公开通过分别提取第一视频的视频图像的图像特征以及描述信息的目标特征,再将图像特征和目标特征进行融合,以得到第一视频最终的视频特征,这一视频特征并不局限于关键词这一单一的维度,而能够充分表征出视频图像及描述信息多种维度上的相关特征,具有更加完备的特征表达能力,从而使得基于这一视频特征进行视频搜索时,能够搜索出更加相似的第二视频,使得视频搜索的准确率大大提升,且具有广泛的应用场景、通用性高。

    文本检测模型的训练方法、文本检测方法及装置

    公开(公告)号:CN113128485A

    公开(公告)日:2021-07-16

    申请号:CN202110285620.4

    申请日:2021-03-17

    Inventor: 吴翔宇 袁玮

    Abstract: 本公开关于一种文本检测模型的训练方法、文本检测方法及装置,该文本检测模型的训练方法包括:获取目标样本图像集,该目标样本图像集包括具有文本框标签的目标样本图像;对目标样本图像进行旋转,得到旋转后的目标样本图像;确定旋转后的目标样本图像中的文本框的目标位置信息;基于旋转后的目标样本图像和该目标位置信息,对神经网络进行文本检测训练,得到目标样本图像对应的文本预测结果;根据文本预测结果和文本框标签,确定损失数据;基于损失数据训练上述神经网络,得到文本检测模型。利用本公开实施例提供的技术方案不仅可以对常见自然场景中的文本识别保持较高的精度,还可以确保对竖排文本检测的较高准确率和召回率。

    用户属性信息的确定方法、装置、电子设备及存储介质

    公开(公告)号:CN111652432A

    公开(公告)日:2020-09-11

    申请号:CN202010485760.1

    申请日:2020-06-01

    Inventor: 吴翔宇 袁玮

    Abstract: 本公开提供了一种用户属性信息的确定方法、装置、电子设备及存储介质,属于互联网技术领域。方法包括:获取用户账户对应的用户名和用户头像;对用户名和用户头像分别进行特征提取,得到第一特征向量和第二特征向量,第一特征向量用于表示用户名的特征,第二特征向量用于表示用户头像的特征;将第一特征向量和第二特征向量输入性别预测模型,基于性别预测模型输出第一概率和第二概率,第一概率用于表示预测为男性的概率,第二概率用于表示预测为女性的概率;根据第一概率和第二概率,确定用户账户对应的性别。上述技术方案,通过用户授权的用户名和用户头像来预测用户账户对应的性别,预测得到的性别较为准确。

    视频搜索方法、装置、计算机设备及存储介质

    公开(公告)号:CN112364204A

    公开(公告)日:2021-02-12

    申请号:CN202011264524.3

    申请日:2020-11-12

    Inventor: 吴翔宇 袁玮

    Abstract: 本公开关于一种视频搜索方法、装置、计算机设备及存储介质,属于计算机领域。本公开通过分别提取第一视频的视频图像的图像特征以及描述信息的目标特征,再将图像特征和目标特征进行融合,以得到第一视频最终的视频特征,这一视频特征并不局限于关键词这一单一的维度,而能够充分表征出视频图像及描述信息多种维度上的相关特征,具有更加完备的特征表达能力,从而使得基于这一视频特征进行视频搜索时,能够搜索出更加相似的第二视频,使得视频搜索的准确率大大提升,且具有广泛的应用场景、通用性高。

    二维码处理方法、装置、电子设备及存储介质

    公开(公告)号:CN110991457B

    公开(公告)日:2023-12-08

    申请号:CN201911175822.2

    申请日:2019-11-26

    Inventor: 吴翔宇 杨帆 袁玮

    Abstract: 本公开关于一种二维码处理方法、装置、电子设备及存储介质,属于图像处理领域。本公开提供的方案,通过将获取到的二维码图像输入至二维码处理模型,通过二维码处理模型,对二维码图像进行卷积处理,得到该二维码图像的第一图像特征,对该第一图像特征进行反卷积处理,得到第二图像特征,基于目标阈值对该第二图像特征进行映射,输出该二维码图像的二值化图像,通过二维码处理模型对图像特征进行提取,可以实现对二维码图像中的阴影或颜色渐变等无用特征的处理,强化二维码图像中的有用特征,从而可以在弱光、强光、低对比度等场景下获取到的图像不够清晰时,也能够实现二维码的识别,提高识别成功率。

Patent Agency Ranking