-
公开(公告)号:CN118015522B
公开(公告)日:2024-09-24
申请号:CN202410336432.3
申请日:2024-03-22
Applicant: 广东工业大学
IPC: G06V20/40 , G06F16/34 , G06V10/62 , G06V10/764 , G06V10/70
Abstract: 本发明涉及计算机图像处理和机器学习领域,更具体,用于视频场景图生成的时间过渡正则化方法和系统,本发明创建以图像的类别和上下文为条件的转换矩阵,以捕获基于每个类别的统计相关性以及基于每个上下文图像的细粒度相关性,并以显式方式将这些相关性合并到当前的VidSGG算法中,以提供更强、更细粒度的正则化,本发明着重解决视频中时间相关性的建模和利用,以提升人工智能对视频内容语义分析性能,在高风险领域,如自动驾驶和医疗诊断中,本发明可以提供更准确的场景图生成,有助于提高决策的可信度。
-
公开(公告)号:CN117935030A
公开(公告)日:2024-04-26
申请号:CN202410336507.8
申请日:2024-03-22
Applicant: 广东工业大学
IPC: G06V10/98 , G06N3/0499 , G06N3/0985 , G06V10/74 , G06V10/762 , G06V10/764 , G06V10/82
Abstract: 本发明公开了一种双视角相关性感知正则化的多标签置信度校准方法,包括:首先进行特定类别对比学习;其次进行实例级相关性感知正则化;然后进行原型级相关感知正则化;最后计算实例级相关性感知正则化平滑后的标签和原型级相关性感知正则化平滑后的标签的损失函数,并结合样本总损失计算得到置信度。本发明通过学习类别相关性来建模语义混淆,引入双重视角的相关性感知正则化,并将这些相关性引入到自适应正则化中,从而提高置信度的准确性,提高了计算机图像处理在高风险领域的实用性。
-
公开(公告)号:CN116012569B
公开(公告)日:2023-08-15
申请号:CN202310299402.5
申请日:2023-03-24
Applicant: 广东工业大学
Abstract: 本发明提供一种基于深度学习的含噪数据下的多标签图像识别方法,包括获取多标签含噪数据集并进行预处理;建立双分支多标签修正神经网络模型;将预处理后的多标签含噪数据集输入双分支多标签修正神经网络模型中进行对比学习训练,获得优化后的双分支多标签修正神经网络模型;获取待修正的含噪图片,利用优化后的双分支多标签修正神经网络模型对待修正的含噪图片进行修正,根据修正标签对待修正的含噪图片进行图像识别;本发明能够对多标签含噪数据集进行标签修正,节省人力物力成本,实现对数据资源的高效利用;同时预测结果更具有鲁棒性;另外,本发明根据对训练图片的预测值规定了上下界,能够减弱噪声,避免对噪声的过拟合。
-
-
公开(公告)号:CN116091668B
公开(公告)日:2023-07-21
申请号:CN202310374538.8
申请日:2023-04-10
Applicant: 广东工业大学
IPC: G06T13/40 , G10L19/16 , G06T13/20 , G06T15/00 , G06V40/16 , G06V20/40 , G06V10/82 , G06V10/80 , G06N3/0455 , G06N3/08
Abstract: 本发明公开一种基于情绪特征指导的说话头视频生成方法,引入了情绪特征指导,训练得到的模型能够具有表达情绪的能力,生成的说话头能够具有丰富的情绪化的逼真表达,可以很好地解决目前说话头中性化固态表达的问题。同时,本发明通过基于二维数据的三维重建技术,从现有的情绪丰富的二维数据集得到近似数据,能够解决缺乏数据的问题。本发明侧重在生成人物形象视频的同时提高其表达的情绪化能力。通过在保证传播内容的同时,赋予视频中的人物与传播内容向匹配的情绪张力,使得视频人物表达更具情感特征,提高虚拟形象真实性,从而提高用户体验。
-
公开(公告)号:CN115034961A
公开(公告)日:2022-09-09
申请号:CN202210752945.3
申请日:2022-06-29
Applicant: 广东工业大学
Abstract: 本发明公开一种虚拟试衣去遮挡方法和系统,方法包括以下步骤:S1:获取原始图像和试穿衣物的图像;S2:训练一个SPN网络;S3:将原始图像中的相关人物的先验语义信息与试穿图像中的衣物信息结合,利用SPN网络的生成器生成试衣图像中人物的语义信息;S4:利用SPN网络的修复器对试衣图像中人物的语义信息进行修复,并与试穿衣物的图像中的衣物信息结合,得到修复的衣物形变图像;S5:对SPN网络得到的人物语义信息进行区域挖掘,找到粘贴OcclusionPatch的区域,将occlusion patch与原图像结合,作为增强数据,将增强数据与修复的衣物形变图像输入人物生成器中,生成无遮挡的试衣图像。本发明在语义信息的指导下,进行衣物遮挡建模,生成合理的躯干信息,增强模型鲁棒性。
-
公开(公告)号:CN118350903A
公开(公告)日:2024-07-16
申请号:CN202410633219.9
申请日:2024-05-21
Applicant: 广东工业大学
IPC: G06Q30/0601 , G06V10/774 , G06F40/126
Abstract: 本发明涉及虚拟试穿技术领域,公开了一种基于语义增强和扩散模型的服装试穿方法、系统和存储介质,包括:确定待试穿的服装图像和文本描述;对所述服装图像和所述文本描述进行语义增强操作,获得文本提示;将所述文本提示和所述服装图像输入训练好的可训练控制网络,获得服装特征图;将所述文本提示和openpose图像输入预训练控制网络,获得姿势特征图;将所述文本提示、所述服装特征图和所述姿势特征图输入至扩散模型中,输出试穿结果图。本发明能够提高服装虚拟试穿的效果和用户体验。
-
公开(公告)号:CN118212671A
公开(公告)日:2024-06-18
申请号:CN202410247832.7
申请日:2024-03-05
Applicant: 广东工业大学
IPC: G06V40/16 , G06V10/82 , G06T11/00 , G06N3/0464 , G06N3/08
Abstract: 本公开了一种基于空间相关性模型的人脸表情操纵视频生成方法与系统,本发明通过构建空间相关性学习模型对前后生成的视频的质量进行定性和定量比较;通过在现有的人脸表情操纵技术中引入额外的监督信号,提高视频的质量。该方法采用全新的监督模块,能够减少视频局部失真,提高用户观感。
-
公开(公告)号:CN116012569A
公开(公告)日:2023-04-25
申请号:CN202310299402.5
申请日:2023-03-24
Applicant: 广东工业大学
Abstract: 本发明提供一种基于深度学习的含噪数据下的多标签图像识别方法,包括获取多标签含噪数据集并进行预处理;建立双分支多标签修正神经网络模型;将预处理后的多标签含噪数据集输入双分支多标签修正神经网络模型中进行对比学习训练,获得优化后的双分支多标签修正神经网络模型;获取待修正的含噪图片,利用优化后的双分支多标签修正神经网络模型对待修正的含噪图片进行修正,根据修正标签对待修正的含噪图片进行图像识别;本发明能够对多标签含噪数据集进行标签修正,节省人力物力成本,实现对数据资源的高效利用;同时预测结果更具有鲁棒性;另外,本发明根据对训练图片的预测值规定了上下界,能够减弱噪声,避免对噪声的过拟合。
-
公开(公告)号:CN119049654A
公开(公告)日:2024-11-29
申请号:CN202411177077.6
申请日:2024-08-26
Applicant: 广东工业大学
Abstract: 本发明涉及麻醉深度预测技术领域,提出一种小样本麻醉深度预测方法及系统,包括:采集麻醉手术记录数据作为源域数据与小样本数据并进行预处理,建立教师模型和学生模型,将所述源域数据输入教师模型进行训练;基于完成训练的教师模型,通过特征蒸馏训练学生模型;对完成特征蒸馏训练的学生模型使用基于标签平滑的重加权损失函数计算损失,并更新所述学生模型的权重;将所述小样本数据输入所述学生模型进行训练,并采用平衡均方误差作为所述学生模型的损失函数;将待预测麻醉深度数据输入完成训练的所述学生模型,得到麻醉深度预测结果。相较于现有技术在不平衡数据上训练效果差的缺陷,本发明提出了一种更高效、精确的求解方法。
-
-
-
-
-
-
-
-
-