-
公开(公告)号:CN115412652B
公开(公告)日:2024-03-22
申请号:CN202110578350.6
申请日:2021-05-26
Applicant: 哈尔滨工业大学(深圳)
IPC: H04N23/50 , G06T11/60 , G06V10/12 , G06V20/50 , G06V10/774 , G06V10/764
Abstract: 本发明公开了一种用于无人售货机的图像数据采集装置和方法,该装置包括拍摄装置、移动装置和控制处理器,控制处理器控制拍摄装置和移动装置实现商品摆放和拿取的自动化过程,并采用自动标注和人工标注相结合的方式进行图像信息标注,本发明提供的技术方案提高了用于无人售货机的图像数据库的采集效率,增强了目标检测模型的识别率。
-
公开(公告)号:CN116091630A
公开(公告)日:2023-05-09
申请号:CN202211357095.3
申请日:2022-11-01
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本公开的实施例提供一种用于训练图像生成模型的方法和装置。图像生成模型包括背景擦除模块、文本转换模块和融合模块。在该方法中,获取训练图像集。训练图像集包括:包含第一文本的风格图像和包含第二文本的内容图像。第一和第二文本分别具有第一和第二文本风格属性。通过背景擦除模块从风格图像中获得背景图像和第一文本掩码图像。第一文本掩码图像被用于计算背景擦除模块的损失函数。通过文本转换模块将内容图像中的第二文本转换为第一文本风格属性以获得转换后的内容图像和第二文本掩码图像。通过融合模块将转换后的内容图像与背景图像融合以得到目标图像。最小化背景擦除模块、文本转换模块和融合模块的损失函数以更新图像生成模型的参数。
-
公开(公告)号:CN115424285A
公开(公告)日:2022-12-02
申请号:CN202210915729.6
申请日:2022-08-01
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本公开的实施例提供一种文本识别方法和文本识别装置。在该文本识别方法中,获取包括文本的图片。文本包括多个字符。通过浅层卷积神经网络来提取图片的特征以生成原始特征图。然后,通过注意力模块分别针对原始特征图的宽度维度和高度维度确定第一和第二注意力区域。将第一和第二注意力区域的重合区域确定为注意力选择区域。接着,根据原始特征图和注意力选择区域来生成候选特征矩阵。之后,将候选特征矩阵与原始特征图相乘以生成特征交互矩阵。对特征交互矩阵进行标准化处理以得到二维注意力权重矩阵。对原始特征图与二维注意力权重矩阵进行点积运算以获得增强特征矩阵。然后,根据增强特征矩阵和文本中的已识别字符来识别文本中的未识别字符。
-
公开(公告)号:CN115412652A
公开(公告)日:2022-11-29
申请号:CN202110578350.6
申请日:2021-05-26
Applicant: 哈尔滨工业大学(深圳)
IPC: H04N5/225 , G06T11/60 , G06V10/12 , G06V20/50 , G06V10/774 , G06V10/764
Abstract: 本发明公开了一种用于无人售货机的图像数据采集装置和方法,该装置包括拍摄装置、移动装置和控制处理器,控制处理器控制拍摄装置和移动装置实现商品摆放和拿取的自动化过程,并采用自动标注和人工标注相结合的方式进行图像信息标注,本发明提供的技术方案提高了用于无人售货机的图像数据库的采集效率,增强了目标检测模型的识别率。
-
-
-