一种多源数据交叉的草坪数据集构建方法及系统

    公开(公告)号:CN118038456A

    公开(公告)日:2024-05-14

    申请号:CN202311631160.1

    申请日:2023-11-30

    Abstract: 本发明属于计算机视觉技术领域,公开了一种多源数据交叉的草坪数据集构建方法及系统,包括:从开源数据集中提取带有草坪标签或者包含草坪区域的图片,作为第一种来源;从实际场景拍摄的视频中提取有用帧,并进行标注,作为第二种来源;利用AIGC生成带有草坪区域和相应标签的图片作为第三种来源;将三种来源的图片进行交叉组合,并进行筛选和校验,得到最终的草坪数据集。本发明利用多种来源的图片交叉构建一个高质量、高覆盖度、高多样性的草坪数据集,提高了数据集的可靠性和泛化能力。

    一种信息融合视觉增强网络方法及计算机设备

    公开(公告)号:CN117522698A

    公开(公告)日:2024-02-06

    申请号:CN202311426090.6

    申请日:2023-10-31

    Abstract: 本发明公开了一种信息融合视觉增强网络方法,包括下列步骤:步骤1:将原始图像放入信息融合图像增强模块;步骤2:高层语义特征提取;步骤3:特征拼接和特征融合;步骤4:模型训练。本发明采用深度学习技术,通过自主学习和参数自动调整,实现了对输入图像内容和特性的智能分析,进而动态选择最优增强方式,无需人工干预,从而大幅提升了操作的便捷性和用户体验。此外,经过性能优化,可广泛应用于实时或高吞吐量的场景。为用户提供了快速且高质量的图像增强服务,有望在多个领域中广泛应用。

    一种基于双路径卷积网络的胎儿镜图像分割方法

    公开(公告)号:CN116012389A

    公开(公告)日:2023-04-25

    申请号:CN202211303336.6

    申请日:2022-10-24

    Abstract: 本发明公开了一种基于双路径卷积网络的胎儿镜图像分割方法,包括获取胎儿镜图像,并划分为训练集和测试集;构建双路径结构的编码器‑解码器网络模型,其中两条路径的编码器、解码器之间采用交换连接进行特征图共享;利用训练集对构建的双路径结构的编码器‑解码器网络模型进行训练;利用训练后的双路径结构的编码器‑解码器网络模型对测试集进行图像分割,得到胎儿镜图像中胎盘血管的分割结果。本发明通过引入了通道注意力机制以及连续卷积结构以使得网络获取到带有权重的多尺度特征;并且,在两条路径的对应模块之间加入了交换连接以加强网络各模块之间的联系;相比于现有的胎盘血管分割方法,分割结果具有更高的准确性,分割效果更优。

    一种基于非负表征样本的协同表示人脸识别方法

    公开(公告)号:CN115798010A

    公开(公告)日:2023-03-14

    申请号:CN202211537199.2

    申请日:2022-12-02

    Inventor: 曾少宁 周健航

    Abstract: 本发明提供了一种基于非负表征样本的协同表示人脸识别方法和C个类别N个人脸图像样本的训练人脸样本集;对训练人脸样本集中的人脸图像样本进行归一化处理;通过协同测试表示测试人脸图像,获取测试人脸图像对应的协同表示系数;使用ReLU函数对测试人脸图像对应的协同表示系数进行映射;对映射后的测试人脸图像对应的协同表示系数进行二阶协同表示,获取二阶协同表示后的测试人脸图像;根据二阶协同表示后的测试人脸图像、训练人脸样本集,基于最近邻子空间分类函数进行人脸识别,识别出测试人脸图像对应的类别。相比于现有技术,本发明的人脸识别算法具备高效率、高识别能力、高稀疏性、高可解释性。

    一种可扩展的农田边界规整简化方法、系统、设备及终端

    公开(公告)号:CN115719355A

    公开(公告)日:2023-02-28

    申请号:CN202211472541.5

    申请日:2022-11-22

    Abstract: 本发明属于人工智能、数字图像处理技术领域,公开了一种可扩展的农田边界规整简化方法、系统、设备及终端,确定待分割的农田类别列表;使用已有的标注训练分割模型,得到所有农田的分割mask;对分割mask进行二值化处理,得到二值化图像;对二值化图像进行数字图像处理,提取各连通域的轮廓;使用图像处理得到的轮廓信息进行多边形近似并除去多余冗余点,获得农田边界表示。本发明的提取局部农田规整边界的处理方法,将使用深度学习分割得到的农田分割结果,使用传统图像处理方法并佐以多边形近似算法进行对结果进行规整化处理,同时对农田的轮廓点进行简化,在减少人力成本的同时,能够较好的平衡农田的边界点数量以及边界描述精度。

    一种基于深度学习的工业仪表指针读数方法及系统

    公开(公告)号:CN118628883A

    公开(公告)日:2024-09-10

    申请号:CN202311515514.6

    申请日:2023-11-14

    Abstract: 本发明属于机器学习领域,提出了一种基于深度学习的工业仪表指针读数方法及系统。系统通过基于YOLOv7网络、注意力串联ELAN模块和注意力并联ELAN模块的优化特征层堆叠和注意力计算过程,实现智能仪表视觉识别框架。刻度提取和最小二乘法的椭圆拟合方法被用于拟合刻度圆和校正仪表图像倾斜。系统进一步引入了基于U‑Net++模型的Attention模块和ECA模块,用于建模特征频道之间的相互依赖关系。滑动角被用于定位指针式仪表盘的起始指针,确定表盘的起始刻度、结束刻度和指针位置。本发明解决了工业场景中指针式仪表读数困难的问题,适应倾斜和透视效应强的指针式仪表,具有广泛的工业应用价值。

    一种图像分类数据增广方法及系统

    公开(公告)号:CN117593581A

    公开(公告)日:2024-02-23

    申请号:CN202311617853.5

    申请日:2023-11-28

    Abstract: 本发明属于图像分类数据增广技术领域,公开了一种基于零样本分割通用视觉大模型的图像分类数据增广方法。本发明利用通用视觉模型的零样本分割能力,对图像分类数据集进行数据增广,能够有效地增加图像分类数据集的多样性,从而提高分类模型的泛化性能。本发明的方法简单易实现,不需要额外的标注数据,只需要输入一个提示框范围值,就能够对图像进行数据增广,节省了人力和时间成本。本发明的方法具有通用性,可以适用于不同的通用视觉模型和图像分类数据集,提高了数据增广的灵活性和可扩展性。

    基于扩散生成的自监督图像数据集构建方法、系统及设备

    公开(公告)号:CN117576515A

    公开(公告)日:2024-02-20

    申请号:CN202311641601.6

    申请日:2023-11-30

    Abstract: 本发明属于计算机视觉中的图像数据集构建技术领域,公开了一种基于扩散生成的自监督图像数据集构建方法、系统及设备,使用包含1000个类名及原始图像的ImageNet‑1K数据集;微调Diffusion预训练模型,Diffusion模型用于生成图像;设计自监督Transformer网络,在训练过程中所用数据集无需人为添加标签,所设计的网络会自动完成自监督任务;加载预训练模型和数据集,初步生成GenImageNet数据集,训练并使用自监督Transformer网络,最终生成高质量数据集。本发明通过引入自监督网络,实现了对生成图像的自动筛选,提高了生成图像的质量。同时,操作简便,易于实现。

    基于图像分割的地理图像标注识别方法、装置和设备

    公开(公告)号:CN115861815A

    公开(公告)日:2023-03-28

    申请号:CN202211570371.4

    申请日:2022-12-07

    Abstract: 本申请涉及图像识别技术领域,提供了一种基于图像分割的地理图像标注识别方法、装置、计算机设备和存储介质。该方法包括:通过获取待识别的地理图像,该地理图像中包括地理要素的初始标注,通过图像分割模型进行推理,得到地理图像中的地理要素的推理标注,根据初始标注和推理标注的对比结果,得到该地理要素的初始标注的识别结果。其中,该图像分割模型时根据校对过标注的地理图像数据集训练得到的,用于识别单一类型的地理要素的模型,每个模型仅识别一种类型的地理要素,避免地理图像上要素交错复杂、难以识别的情形,提高地理要素标注识别的准确性和效率。

Patent Agency Ranking