基于数字文化熵回归的国画实例分割方法

    公开(公告)号:CN117036687A

    公开(公告)日:2023-11-10

    申请号:CN202310786833.4

    申请日:2023-06-30

    Abstract: 本发明基于数字文化熵回归的国画实例分割方法,本分割方法包括以下步骤:S1、将图像输入残差特征提取网络5层特征图,以不同策略将各层次特征融合获取细节与语义信息;S2、计算图像色彩空间的信息熵,并计算主色调占比,以主色调占比和LAB信息熵结合组成颜色丰富度的表征,预测图像中所有位置语义类别和实例组成,与ground truth进行对比计算损失函数;S3、定位实例对象中心坐标,根据特征图和中心点特征,计算轮廓点相对中心点坐标的偏移量,得到初始轮廓,在轮廓上随机选取128个采样点,预测该点与实例的位置关系。本发明在工笔画图像上获得最优分割效果,可以实现对国画工笔画的实例分割,帮助用户提取其中的文化元素。

    一种基于显著性先验的图像自动分割方法

    公开(公告)号:CN113160251A

    公开(公告)日:2021-07-23

    申请号:CN202110562949.0

    申请日:2021-05-24

    Abstract: 本发明涉及一种基于显著性先验的图像自动分割方法,包括以下步骤:通过背景先验显著性方法计算图像在不同超像素尺度下的显著图;采用中心‑原理公式对显著图进行增强;将增强后的显著图进行图像融合,获取融合显著图;提取原图像的RGB颜色特征、LAB颜色特征和OTC纹理特征;根据颜色特征和纹理特征对图像像素进行相似性度量;根据像素相似性对融合显著图进行处理,将符合相似性规则的像素标记为前景种子点,将不符合相似性规则的像素标记为背景种子点;通过图割原理完成对图像的自动分割。本发明方法能够自动获取种子点,同时克服光照对分割的影响,解决了现有图像分割方法需要人工参与且易受光照影响的问题。

    一种基于基因学习模型的曲艺视频标注方法

    公开(公告)号:CN118823627A

    公开(公告)日:2024-10-22

    申请号:CN202410717013.4

    申请日:2024-06-04

    Abstract: 本发明公开了一种基于基因学习模型的曲艺视频标注方法,本方法包括以下步骤:S1、提取视频的关键帧,记录关键帧在曲艺视频所有帧中的下标,计算当前关键帧的时间,并将关键帧输入特征提取网络进行特征提取;S2、分离曲艺视频的音频,提取音频特征;S3、将每个关键帧的视觉特征以及音频特征进行同步聚合,得到每帧的多模态融合特征,对所有关键帧的多模态融合特征进行时序聚合,得到视频级时序聚合特征;S4、根据得到的视频级时序聚合特征进行推理,得到视频级特征,根据得到的关键帧特征进行推理得到视频帧级特征;本发明可以实现对传统曲艺视频的多粒度标注,有助于后续对该视频的管理、检索,有利于传播中华文化。

    一种基于显著性先验的图像自动分割方法

    公开(公告)号:CN113160251B

    公开(公告)日:2023-06-09

    申请号:CN202110562949.0

    申请日:2021-05-24

    Abstract: 本发明涉及一种基于显著性先验的图像自动分割方法,包括以下步骤:通过背景先验显著性方法计算图像在不同超像素尺度下的显著图;采用中心‑原理公式对显著图进行增强;将增强后的显著图进行图像融合,获取融合显著图;提取原图像的RGB颜色特征、LAB颜色特征和OTC纹理特征;根据颜色特征和纹理特征对图像像素进行相似性度量;根据像素相似性对融合显著图进行处理,将符合相似性规则的像素标记为前景种子点,将不符合相似性规则的像素标记为背景种子点;通过图割原理完成对图像的自动分割。本发明方法能够自动获取种子点,同时克服光照对分割的影响,解决了现有图像分割方法需要人工参与且易受光照影响的问题。

    一种基于超像素多特征融合的快速图像分割方法

    公开(公告)号:CN109712143B

    公开(公告)日:2021-01-26

    申请号:CN201811619273.9

    申请日:2018-12-27

    Abstract: 本发明涉及一种基于超像素多特征融合的快速图像分割方法,通过把图像进行超像素预分割,计算各超像素与其他超像素之间的HOG特征相似性度量、强度特征相似性度量和空间位置特征相似性度量,然后获得超像素之间的多特征相似性度量,依据所述多特征相似性度量,把所述超像素预分割图像转换为相似性关系无向图,并依据图割理论对相似性关系无向图进行划分,分割出所述分割对象。本发明相比基于像素级的图像分割方法,对高分辨率图像进行分割时,具有分割速度快,鲁棒性好等优点。

    一种中文古籍图像的数字化方法
    6.
    发明公开

    公开(公告)号:CN118675190A

    公开(公告)日:2024-09-20

    申请号:CN202410717047.3

    申请日:2024-06-04

    Abstract: 本发明公开了一种中文古籍图像的数字化方法,本方法包括以下步骤:S1、构建中文古籍图像数据库,构建文本检测和文本识别模型;S2、定位古籍图像中的文本位置,将待识别的中文古籍图像送入文本检测模型,绘制文本检测框;S3、取得检测结果,将检测出的文本区域送入文本识别模型,按阅读顺序输出得到识别结果;S4、纠错识别结果,针对文本行识别置信度较低的识别结果进行文本纠错;本发明构建丰富多样的数据集使得算法具有较强的稳定性,改进的文本检测算法能够较好的适应复杂版式下的中文古籍图像,改进后的文本识别算法能取得较好的识别结果,并在一定程度上支持生僻字和异体字的识别,在实现中文古籍图像的数字化上提供了更加高效的解决方案。

    一种基于基因学习模型的传统纹样多标签标注方法

    公开(公告)号:CN118674975A

    公开(公告)日:2024-09-20

    申请号:CN202410685803.9

    申请日:2024-05-30

    Abstract: 本发明公开了一种基于基因学习模型的传统纹样多标签标注方法,包括步骤S1得到特征向量;S2、构件专家关联词表;S3、将特征向量输出至线性分类器;S4、计算分类结果向量;本发明使用字典学习的方法对纹样基因进行表征,即是在图像特征描述的维度下,找到数个基向量对纹样基因的特征进行描述;并且鉴于生物基因组所承载的学习能力遗传机制,引入一种具备迁移学习和先验信息传递功能的基因学习模型;引入专家关联词表,强化模型学习能力;使用深度学习优化字典学习算法结构,注重模型表示能力,多层字典学习中施加全局相似度与Fisher判别约束,简约表示的同时增强字典的识别能力,并且减少人工劳动力,提高标注效率。

    一种基于颜色分层的图像压缩编码方法

    公开(公告)号:CN120014076A

    公开(公告)日:2025-05-16

    申请号:CN202411971729.3

    申请日:2024-12-30

    Abstract: 本发明公开了一种基于颜色分层的图像压缩编码方法,本图像压缩编码方法具体包括以下步骤:S1、输入颜色个数,使用颜色聚类算法得到颜色分层;S2、对每个颜色分层进行编码,用轮廓与颜色采样点简约表示;S3、从编码信息利用生成网络解码得到原真重构图像;本发明解决了图像压缩编码的简约表征,进而提高传输效率的难题;编码阶段将图像划分为多个颜色层,通过边缘和颜色联合采样,构建不同分层的单一颜色表征模型;解码阶段引入具有细粒度判别能力的GAN模型,生成边缘和色彩失真较少的图像,并基于颜色分层编码策略,提高图像传输压缩率并保持图像较高原真性。

    联合全局约束和支持向量引导的多层字典学习标注方法

    公开(公告)号:CN118097299A

    公开(公告)日:2024-05-28

    申请号:CN202410383892.1

    申请日:2024-04-01

    Abstract: 本发明公开了联合全局约束和支持向量引导的多层字典学习标注方法,涉及计算机视觉技术领域,该多层字典学习标注方法包括以下步骤:构建局部与全局相结合的特征,并获得表示输入图像特征的非线性关系;利用支持向量判别项表示所有编码向量对之间距离平方的加权和,并为不同的编码向量对自适应分配不同的权重。通过引入全局约束字典学习揭示数据的流形结构可以使系数表示表现出较高的类内相似性,引入支持向量判别项,将判别项表示为所有编码向量对之间的距离平方的加权和,可以自适应地为不同的编码向量对分配不同的权重,自动选择少数关键对来分配非零权重,从而为图像标注任务提供更好的泛化能力。

    一种基于法线优化的文物三维重建方法

    公开(公告)号:CN116977595A

    公开(公告)日:2023-10-31

    申请号:CN202310794817.X

    申请日:2023-06-30

    Abstract: 本发明一种基于法线优化的文物三维重建方法,本分割方法包括以下步骤:S1、采集在三个方向的二元梯度照明的图像,获得文物多视角图像;S2、根据梯度照明图像计算文物表面法线;S3、使用文物多视角图像重建文物三维纹理模型;其中步骤S2包括a1、反射分离,a2、计算混合法线,a3、计算镜面反射法线;步骤S3包括b1、稀疏点云重建,b2、密集点云重建,b3、法线深度优化,b4、网格重建和b5、纹理映射。本发明解决少量视角深度估计中存在孔洞和离群点导致网格重建表现能力不足的问题,提出先使用基于弱支持表面网格重建方法,获得初步的网格模型,该网格模型孔洞已经补全并且离群点的问题得到解决,然后使用泊松重建的方法获得平滑的网格模型。

Patent Agency Ranking