基于数据扰动的跨域自适应语义分割方法及装置

    公开(公告)号:CN113627433A

    公开(公告)日:2021-11-09

    申请号:CN202110680850.0

    申请日:2021-06-18

    Abstract: 本发明提供的一种基于数据扰动的跨域自适应语义分割方法及装置,该方法包括,获取待处理数据以及添加数据扰动后的语义分割特征;基于所述待处理数据以及所述语义分割特征确定损失函数;基于所述损失函数通过误差反向传播算法训练模型得到跨域自适应语义分割模型,通过对目标域中大量无标签数据,本发明对这部分数据随机加入扰动,并保证经过扰动处理的图像能够保持语义的一致性,从数据扰动和跨域原型分类器两个角度解决了源域和目标域之间的领域不一致问题,并且针对在现实应用中更具实际应用价值的少量监督问题做了针对性的设计,并在基于对抗的学习框架下,取得了优秀的分割性能,将现有的标注样本的知识迁移到新数据模型中。

    基于数据分布扩充的跨域自适应语义分割方法及系统

    公开(公告)号:CN113221902B

    公开(公告)日:2021-10-15

    申请号:CN202110511220.0

    申请日:2021-05-11

    Abstract: 本发明涉及一种基于数据分布扩充的跨域自适应语义分割方法及系统,所述跨域自适应语义分割方法包括:获取不同域训练数据集;分别对源域图像及目标域图像进行傅里叶变换,得到对应的源频域图像及目标频域图像;对源频域图像进行高频滤波,得到高频信息;对目标频域图像进行低频率波,得到低频信息;根据高频信息及低频信息,通过傅里叶反变换,得到转换图像;基于转换图像,对源域图像及目标域图像进行数据增强,得到源域扩充图像及目标域扩充图像;确定第一语义分割损失模型、第一对抗损失函数、第二对抗损失函数、语义一致性损失函数;确定第二语义分割损失模型;基于第二语义分割损失模型,可对待处理图像进行准确的语义分割,提高分割精度。

    虚拟场景生成方法及系统
    13.
    发明公开

    公开(公告)号:CN119166236A

    公开(公告)日:2024-12-20

    申请号:CN202411230607.9

    申请日:2024-09-03

    Abstract: 本公开涉及计算机领域和人工智能领域,提供一种虚拟场景生成方法及系统,所述虚拟场景生成方法包括:规划智能体接收用户输入的场景生成指令;所述规划智能体根据预设资源库中的插件注释信息,从所述预设资源库中选择用于生成所述目标场景的程序化内容生成插件,生成用于生成所述目标场景的任务计划;执行智能体利用从所述预设资源库中选择的程序化内容生成插件,执行所述任务计划,以生成所述目标场景。本公开可以解决难以提升生成虚拟场景的工作效率的问题,可以自动化地生成目标场景,而无需用户深度参与PCG插件的选择、应用、调整等场景生成过程,提升工作效率。

    基于数据扰动的跨域自适应语义分割方法及装置

    公开(公告)号:CN113627433B

    公开(公告)日:2024-04-09

    申请号:CN202110680850.0

    申请日:2021-06-18

    Abstract: 本发明提供的一种基于数据扰动的跨域自适应语义分割方法及装置,该方法包括,获取待处理数据以及添加数据扰动后的语义分割特征;基于所述待处理数据以及所述语义分割特征确定损失函数;基于所述损失函数通过误差反向传播算法训练模型得到跨域自适应语义分割模型,通过对目标域中大量无标签数据,本发明对这部分数据随机加入扰动,并保证经过扰动处理的图像能够保持语义的一致性,从数据扰动和跨域原型分类器两个角度解决了源域和目标域之间的领域不一致问题,并且针对在现实应用中更具实际应用价值的少量监督问题做了针对性的设计,并在基于对抗的学习框架下,取得了优秀的分割性能,将现有的标注样本的知识迁移到新数据模型中。

    文本生成图像的方法及装置
    15.
    发明公开

    公开(公告)号:CN117593419A

    公开(公告)日:2024-02-23

    申请号:CN202311352266.8

    申请日:2023-10-18

    Abstract: 本发明提供一种文本生成图像的方法及装置,该方法包括:确定输入的第一文本描述中的各概念在文本生成图像模型生成的图像中对应的预测位置框,所述文本生成图像模型根据第二噪声图像、第二文本描述和输入的参考图像,基于文本反转方法训练得到,所述第一文本描述和所述第二文本描述中包括目标概念,所述参考图像包括所述目标概念的对象;将第一噪声图像和第一文本描述输入文本生成图像模型,根据文本生成图像模型对第一噪声图像每次去噪后的图像确定各概念的注意力图,根据各概念的注意力图在各概念对应的预测位置框上的聚集损失对去噪后的图像进行再次去噪,直到满足预设条件。本发明实现生成图像中不丢失其他概念的对象。

    类别增量语义分割学习方法及语义分割方法

    公开(公告)号:CN116977635A

    公开(公告)日:2023-10-31

    申请号:CN202310890134.4

    申请日:2023-07-19

    Abstract: 本发明涉及计算机视觉技术领域,提供一种类别增量语义分割学习方法及语义分割方法,通过将当前阶段的图像样本输入至当前阶段的主网络模型,得到第一结果,通过图像样本中的类别标签与对第一结果进行划分得到的第三结果,采用二分类约束方法计算增量学习损失,通过将当前阶段的图像样本输入至前一阶段的语义分割模型,得到第二结果,并通过第二结果与对第一结果进行划分得到的第四结果计算知识蒸馏损失。通过采用二分类约束方法,可以对增量学习过程中保持前阶段所学习旧知识和学习现阶段新知识两个目标进行解耦,从而使第三结果的有监督学习以及对第四结果的知识蒸馏这两个过程的独立进行,加强语义分割模型最终对所有已知类别的语义分割效果。

    基于困难样本挖掘的模型训练方法、设备和存储介质

    公开(公告)号:CN116704217A

    公开(公告)日:2023-09-05

    申请号:CN202310370230.6

    申请日:2023-04-07

    Abstract: 本发明实施例提供了一种基于困难样本挖掘的模型训练方法、设备和存储介质,涉及人工智能技术领域,该方法包括:获取当前迭代过程中基于第一图像对第一模型训练得到的模型参数,更新第二模型的模型参数;基于更新后的第二模型,确定原始图像中各图像块对应的预测重建损失;基于预测重建损失及预设困难样本需求,生成目标掩码策略;基于目标掩码策略,更新第一图像,用于下次迭代过程中对第一模型进行训练,直至第一模型的损失函数达到收敛或迭代过程的次数达到预设的迭代总次数。本发明基于第一模型的迭代训练过程,不断更新掩码策略,帮助模型学习到更具有迁移性的特征表示,提高第一模型的表征能力,避免掩码学习对人工预定义的掩码规则的依赖。

    基于数据分布扩充的跨域自适应语义分割方法及系统

    公开(公告)号:CN113221902A

    公开(公告)日:2021-08-06

    申请号:CN202110511220.0

    申请日:2021-05-11

    Abstract: 本发明涉及一种基于数据分布扩充的跨域自适应语义分割方法及系统,所述跨域自适应语义分割方法包括:获取不同域训练数据集;分别对源域图像及目标域图像进行傅里叶变换,得到对应的源频域图像及目标频域图像;对源频域图像进行高频滤波,得到高频信息;对目标频域图像进行低频率波,得到低频信息;根据高频信息及低频信息,通过傅里叶反变换,得到转换图像;基于转换图像,对源域图像及目标域图像进行数据增强,得到源域扩充图像及目标域扩充图像;确定第一语义分割损失模型、第一对抗损失函数、第二对抗损失函数、语义一致性损失函数;确定第二语义分割损失模型;基于第二语义分割损失模型,可对待处理图像进行准确的语义分割,提高分割精度。

Patent Agency Ranking