图像检测模型的训练方法及装置
    12.
    发明公开

    公开(公告)号:CN116563581A

    公开(公告)日:2023-08-08

    申请号:CN202310491483.9

    申请日:2023-05-04

    Abstract: 本说明书实施例提供了图像检测模型的训练方法及装置,其中,一种图像检测模型的训练方法包括:将第一样本图像集与第二样本图像集输入待训练的教师网络进行类别匹配,获得类别匹配概率;将所述第一样本图像集与所述第二样本图像集输入待训练的学生网络,以根据所述第一样本图像集与所述第二样本图像集对应的相似度矩阵,对各样本图像进行多元特征生成以及特征融合,获得多元特征集和融合特征集,以及基于所述类别匹配概率、所述多元特征集和所述融合特征集,计算训练损失,并基于所述训练损失对所述待训练的学生网络和所述待训练的教师网络进行参数调整,实现对学生网络和教师网络的配合训练。

    图像处理方法、装置、存储介质以及终端

    公开(公告)号:CN115713768A

    公开(公告)日:2023-02-24

    申请号:CN202211421778.0

    申请日:2022-11-14

    Abstract: 本说明书实施例公开了一种图像处理方法、装置、存储介质以及终端,首先对确定出待处理图像中的目标文档区域,去除待处理图像中可能对关键点判定产生干扰的图像区域,进一步确定第一关键点,并根据第一关键点与标准处理区域的第二关键点确定出处理目标文档区域的转换矩阵,由于标准处理区域为符合预设处理、展示要求的区域,那么基于转换矩阵对目标文档区域进行转换之后,可以得到与标准处理区域规格相同的目标文档图像,实现目标图像处理效果。

    图片识别方法及装置
    16.
    发明授权

    公开(公告)号:CN114529993B

    公开(公告)日:2024-09-24

    申请号:CN202210181146.5

    申请日:2022-02-25

    Abstract: 本说明书实施例提供图片识别方法及系统,其中所述图片识别方法包括:将待识别图片输入预先训练的图片识别模型,其中,所述图片识别模型基于有标签图片样本以及满足预设规则的无标签图片样本训练获得;获取所述图片识别模型对所述待识别图片的识别结果,基于所述识别结果确定所述待识别图片是否为风险图片。该方法通过基于有标签图片样本以及满足预设规则的无标签图片样本训练获得的图片识别模型,识别输入的待识别图片是否为风险图片,从而提高了风险图片的识别效率,降低了图片验证过程的难度。

    文档图像的处理方法及装置

    公开(公告)号:CN118522018A

    公开(公告)日:2024-08-20

    申请号:CN202410961302.9

    申请日:2024-07-17

    Abstract: 本说明书实施例提供了文档图像的处理方法及装置,其中,一种文档图像的处理方法包括:在文档图像的解析过程中,一方面对文档图像中的图像块进行特征提取获得图像特征,基于虚拟文本特征与图像特征进行注意力计算并根据获得的注意力权重和图像特征计算注意力图像特征,另一方面对文档图像的解析任务文本进行特征提取获得文本特征,将两方面获得的文本特征与注意力图像特征进行拼接获得拼接特征并输入大模型,由大模型的处理模块按照文本特征对注意力图像特征进行图像解析处理获得图像解析结果,以此在多模态特征拼接的基础上实现文档图像的解析。

    图像识别模型的训练方法及装置、图像识别方法及装置

    公开(公告)号:CN116503876A

    公开(公告)日:2023-07-28

    申请号:CN202310464514.1

    申请日:2023-04-24

    Abstract: 本说明书实施例提供图像识别模型的训练方法及装置、图像识别方法及装置,其中所述图像识别模型的训练方法包括:获取样本文本图像和样本文本图像的样本文本标签;通过图像识别模型确定样本文本图像对应视觉维度的第一全局特征,以及通过文本识别模型确定样本文本标签对应语言维度的第二全局特征;根据第一全局特征和第二全局特征对图像识别模型进行迭代训练,直至获得满足模型训练结束条件的目标图像识别模型;其中,目标图像识别模型的识别结果融合视觉维度和语言维度分别对应的语义特征。在训练阶段基于第一全局特征和第二全局特征进行迭代训练,使模型具备视觉和语言两种编码能力,提高识别效率和准确率。

Patent Agency Ranking