-
公开(公告)号:CN117275008A
公开(公告)日:2023-12-22
申请号:CN202311140736.4
申请日:2023-09-05
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于圆形检测的高效鲁棒印章检测与文字识别方法,其步骤包括:1)基于圆检测的技术从待检测图片中获取候选印章区域;2)对所述候选印章区域进行拉直,将所述候选印章区域中的环形文字变水平后进行文字识别;3)利用印章中的图片对称性和文字特性,对所述候选印章区域进行过滤,得到该待检测图片中的印章区域,并输出所述印章区域中的文字。本发明鲁棒性更强,可检测出模糊彩色图像、黑白图像、含多个印章、残缺扭曲和光线不一致环境下的印章;且针对文字扭曲严重的印章,文字识别的最小编辑距离优于其他平台;本发明在不依靠GPU的条件下,极大提高了印章检测效率,且检测印章区域更为准确,减少了非印章区域的文字引入。
-
公开(公告)号:CN107818149B
公开(公告)日:2021-10-08
申请号:CN201710992552.9
申请日:2017-10-23
Applicant: 中国科学院信息工程研究所
IPC: G06F16/901 , G06F16/904 , G06T11/20
Abstract: 本发明涉及一种基于力导引算法的图数据可视化布局优化方法。该方法在力导引算法的循环迭代过程中增加以下处理步骤,以优化图数据可视化布局:在结点粘连的情况下,通过随机函数给出结点弹开的位置和结点弹开的方向,从而将粘连结点彼此分开一定的距离,使得结点粘连情况下的吸引力和排斥力能够计算。进一步地,本发明在力导引算法的位移计算中对参数delta值采用梯度设置,使得图数据可视化布局过程减少震荡并快速收敛。本发明能够解决基础力导引布局算法中存在的上述问题,在优化算法布局效果的同时,提升算法的布局效率。
-
公开(公告)号:CN107818149A
公开(公告)日:2018-03-20
申请号:CN201710992552.9
申请日:2017-10-23
Applicant: 中国科学院信息工程研究所
CPC classification number: G06F17/30958 , G06F17/30994 , G06T11/203
Abstract: 本发明涉及一种基于力导引算法的图数据可视化布局优化方法。该方法在力导引算法的循环迭代过程中增加以下处理步骤,以优化图数据可视化布局:在结点粘连的情况下,通过随机函数给出结点弹开的位置和结点弹开的方向,从而将粘连结点彼此分开一定的距离,使得结点粘连情况下的吸引力和排斥力能够计算。进一步地,本发明在力导引算法的位移计算中对参数delta值采用梯度设置,使得图数据可视化布局过程减少震荡并快速收敛。本发明能够解决基础力导引布局算法中存在的上述问题,在优化算法布局效果的同时,提升算法的布局效率。
-
公开(公告)号:CN119600643A
公开(公告)日:2025-03-11
申请号:CN202411474911.8
申请日:2024-10-22
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种零样本图像分类方法及装置,属于图像识别领域。本发明通过大型语言模型生成类别描述文档,通过视觉编码器和文本编码器获取图像和文档的全局和局部特征信息,然后通过视觉语义分解模块和文本语义分解模块进行解耦,生成视觉语义嵌入和文本语义嵌入;通过上述模块的联合训练,并优化由局部到语义映射方差损失、多语义多样性损失、分解语义对齐损失和局部语义对齐损失组成的总损失;训练完成后用于推理阶段的图像类别预测。本发明可以降低零样本图像分类的难度,提高分类准确率和效率。
-
公开(公告)号:CN118523943A
公开(公告)日:2024-08-20
申请号:CN202410708254.2
申请日:2024-06-03
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , G06F18/214 , G06N3/0455 , G06N3/0895 , G06N3/096
Abstract: 本发明公开一种基于对比学习预训练的不均衡加密流量识别方法及系统,属网络流量分析技术领域。所述方法包括:对无标注的不均衡加密流量进行会话流提取,并生成会话流的流量表示;构造由会话流的流量表示组成的正负对三元组,并分别基于所述正负对三元组和所述会话流的流量表示进行对比学习的自监督训练和掩码预测的自监督训练,以生成预训练的不均衡加密流量识别模型;利用无标注的不均衡加密流量和带标注的不均衡加密流量对预训练的不均衡加密流量识别模型进行微调,得到训练好的不均衡加密流量识别模型;基于训练好的不均衡加密流量识别模型完成不均衡加密流量的识别任务。本发明可以解决数据不平衡带来的少样本类误分问题。
-
公开(公告)号:CN117609597A
公开(公告)日:2024-02-27
申请号:CN202311151092.9
申请日:2023-09-07
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9535 , G06F18/25 , G06F18/214 , G06N3/0455 , G06N3/0895 , G06Q30/0601
Abstract: 本发明提出了基于VLP输入端细粒度对齐的跨模态赞助搜索方法及系统,涉及跨模态数据搜索领域,由商品目标表示构建视觉向量表示空间,由商品描述单词嵌入构建语言单词向量表示空间,通过线性映射对齐这两个空间;基于前述线性映射构建对齐模块VALSE并进行对抗训练、结构粗略调整和语义监督的精细调整;构建Vin‑VALSE模型,参数初始化后利用训练好的VALSE替换该模型的线性映射层,然后利用跨模态赞助搜索训练数据进行微调;利用微调完成后的Vin‑VALSE对用户查询输入的文本信息进行处理,找出对应的商品信息。本发明旨在改进电商平台中商品和用户查询之间的匹配效率和准确性,尤其是在数据稀缺的条件下。
-
公开(公告)号:CN117453943A
公开(公告)日:2024-01-26
申请号:CN202311123147.5
申请日:2023-09-01
Applicant: 中国科学院信息工程研究所
IPC: G06F16/583 , G06V20/70 , G06V30/18 , G06V30/19 , G06V10/74 , G06V10/764
Abstract: 本发明公开了一种基于预训练跨模态检索的小样本多要素场景图像识别方法,其步骤包括:1)建立图像数据库,包括多个通用场景类别的图像和若干目标场景类别的图像,每一场景类别包括多个图像,每一图像设置对应的场景类别标签;2)利用场景识别模型提取图像数据库中每一场景类别图像的特征,得到每一场景类别对应的特征数据库;根据特征数据库中同一图像的特征生成一特征向量;3)对于一待类别识别的图像A,利用场景识别模型提取该图像A的特征并生成一特征向量;4)场景识别模型将该图像A的特征向量分别与各所述特征数据库中的特征向量进行相似度计算;将相似度最高的特征向量对应的图像的场景类别作为该图像A的场景类别。
-
公开(公告)号:CN117150068A
公开(公告)日:2023-12-01
申请号:CN202311123142.2
申请日:2023-09-01
Applicant: 中国科学院信息工程研究所
IPC: G06F16/583 , G06F16/53 , G06N3/0895 , G06V30/18 , G06V30/19
Abstract: 本发明提出基于自监督对比学习概念对齐的跨模态检索方法及系统,属于信息技术领域,通过独立嵌入模型从给定图像‑文本对中提取视觉局部区域特征和文本局部特征,局部概念对齐模块根据对象特征和单词特征的语义相似性,建立每个单词与最相似对象之间的对应关系,生成正样本;将正样本的对象特征映射到概念码本上,计算对象特征与概念原型的关联概率并作为视觉分配权重;根据对象原型任务训练局部概念对齐模块,增强独立嵌入模型;训练完成后,使用增强的独立嵌入模型进行图像和文本的跨模态检索。本发明能够实现图像对象与文本单词的细粒度对齐,使得在原模型的全局表征的细粒度信息的基础上,在保持图文检索的精度的基础上提高检索效率。
-
公开(公告)号:CN115269925A
公开(公告)日:2022-11-01
申请号:CN202210724045.8
申请日:2022-06-23
Applicant: 中国科学院信息工程研究所
IPC: G06F16/901
Abstract: 本发明公开了一种基于层次结构的无偏置场景图生成方法。本方法为:1)利用有偏模型对图像样本进行处理,得到有偏模型预测结果;根据各图像样本对应的所述有偏模型预测结果构建一层次化关系树;其中,所述有偏模型为场景图生成模型;2)根据所述层次化关系树和设定的层次化关系损失函数,计算损失值;然后基于所述损失值利用梯度反向传播方法优化所述有偏模型,使所述有偏模型输出结果迭代优化,最终输出无偏置场景图;3)对于一待处理的图像,将其输入步骤2)优化后的所述有偏模型,得到对应的无偏置场景图。本发明能够让模型由粗到细地学习不同关系间的区别,从高度有偏的长尾场景图数据中生成无偏置场景图。
-
公开(公告)号:CN109783696B
公开(公告)日:2021-06-04
申请号:CN201811466997.4
申请日:2018-12-03
Applicant: 中国科学院信息工程研究所
IPC: G06F16/901 , G06F16/2458
Abstract: 本发明公开了一种面向弱结构相关性的多模式图索引构建方法及系统。本方法为:1)读取目标领域的模式图集合中的模式图并为每一模式图生成一模式图标志ID;2)构建模式图同构树:对各模式图进行两两判断,如果两个模式图之间存在子图同构关系,则添加一条从规模较小模式图指向规模较大模式图的有向边,得到模式图集合的模式图同构树;3)对模式图同构树进行频繁子图挖掘,找到公共模式图并将其加入到模式图同构树中;4)当模式图同构树中存在一子模式图具有多个父模式图时,则为该子模式图保留唯一的父模式图;5)计算模式图同构树的最小生成树,并对其进行深度优先遍历,得到模式图集的最优匹配顺序。本发明能够大大提高匹配效率。
-
-
-
-
-
-
-
-
-