-
公开(公告)号:CN114359908A
公开(公告)日:2022-04-15
申请号:CN202111550512.1
申请日:2021-12-17
Applicant: 浙江大学
IPC: G06V30/148 , G06V30/16
Abstract: 本发明涉及基于像素点级注意力机制的商品图片可读文字甄别方法,包括:通过OCR技术获取商品图片的文字块坐标及文字内容;通过像素点级注意力机制获取文字块的可读置信度;通过自适应阈值和各文字块的可读置信度进行可读文字筛选,改进了现有技术中,利用预训练语言模型对文字块进行筛选时,受到语料库限制造成的矫正结果单一的问题,从而提高了筛选的准确度。
-
公开(公告)号:CN114494763A
公开(公告)日:2022-05-13
申请号:CN202111550515.5
申请日:2021-12-17
Applicant: 浙江大学
IPC: G06V10/764 , G06V10/80 , G06V30/148 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于特征融合的商品详情图版式分类方法,其中商品详情图版式特指图片上的元素如图片、文字的排列和设计方式。所述方法通过计算机视觉技术定位商品详情图中各文字块的位置;利用各文本块的坐标位置提取商品详情图的版式空间特征;通过自然语言处理技术提取各文字块内部的版式语义特征;将版式空间特征和版式语义特征融合,利用机器学习方法对版式进行分类。该发明有助于探究商品详情图版式对于用户的影响,可用于为在线选购商品的用户推荐其感兴趣的商品,同时为设计商品详情图的人员提供设计建议。
-