-
公开(公告)号:CN116091668B
公开(公告)日:2023-07-21
申请号:CN202310374538.8
申请日:2023-04-10
Applicant: 广东工业大学
IPC: G06T13/40 , G10L19/16 , G06T13/20 , G06T15/00 , G06V40/16 , G06V20/40 , G06V10/82 , G06V10/80 , G06N3/0455 , G06N3/08
Abstract: 本发明公开一种基于情绪特征指导的说话头视频生成方法,引入了情绪特征指导,训练得到的模型能够具有表达情绪的能力,生成的说话头能够具有丰富的情绪化的逼真表达,可以很好地解决目前说话头中性化固态表达的问题。同时,本发明通过基于二维数据的三维重建技术,从现有的情绪丰富的二维数据集得到近似数据,能够解决缺乏数据的问题。本发明侧重在生成人物形象视频的同时提高其表达的情绪化能力。通过在保证传播内容的同时,赋予视频中的人物与传播内容向匹配的情绪张力,使得视频人物表达更具情感特征,提高虚拟形象真实性,从而提高用户体验。
-
公开(公告)号:CN116012569A
公开(公告)日:2023-04-25
申请号:CN202310299402.5
申请日:2023-03-24
Applicant: 广东工业大学
Abstract: 本发明提供一种基于深度学习的含噪数据下的多标签图像识别方法,包括获取多标签含噪数据集并进行预处理;建立双分支多标签修正神经网络模型;将预处理后的多标签含噪数据集输入双分支多标签修正神经网络模型中进行对比学习训练,获得优化后的双分支多标签修正神经网络模型;获取待修正的含噪图片,利用优化后的双分支多标签修正神经网络模型对待修正的含噪图片进行修正,根据修正标签对待修正的含噪图片进行图像识别;本发明能够对多标签含噪数据集进行标签修正,节省人力物力成本,实现对数据资源的高效利用;同时预测结果更具有鲁棒性;另外,本发明根据对训练图片的预测值规定了上下界,能够减弱噪声,避免对噪声的过拟合。
-
公开(公告)号:CN118172452B
公开(公告)日:2024-08-27
申请号:CN202410604983.3
申请日:2024-05-15
Applicant: 广东工业大学
IPC: G06T13/20 , G06T13/40 , G06N3/0455 , G06N3/0475 , G06N3/094
Abstract: 本发明涉及计算机视觉技术领域,公开了一种基于时间相关性的头部动画生成方法及装置,方法包括利用音频和视频片段提取特征向量并计算它们的时间相关性,建立对应的协方差矩阵训练头部动画生成模型,利用通道注意力机制单元对视频特征向量和音频协方差矩阵进行增强处理,得到特征增强网络输入已训练好的头部动画生成模型,生成头部动画。本发明通过构建音频协方差矩阵和视频协方差矩阵来细致地分析音视频之间的时间同步性,能够有效地捕捉并利用音频和视觉内容之间的时序关联,改善了音频驱动的头部动画生成,提供了更加流畅和真实的视觉表现,从而提高动画的真实性和自然度。
-
公开(公告)号:CN116091668A
公开(公告)日:2023-05-09
申请号:CN202310374538.8
申请日:2023-04-10
Applicant: 广东工业大学
IPC: G06T13/40 , G10L19/16 , G06T13/20 , G06T15/00 , G06V40/16 , G06V20/40 , G06V10/82 , G06V10/80 , G06N3/0455 , G06N3/08
Abstract: 本发明公开一种基于情绪特征指导的说话头视频生成方法,引入了情绪特征指导,训练得到的模型能够具有表达情绪的能力,生成的说话头能够具有丰富的情绪化的逼真表达,可以很好地解决目前说话头中性化固态表达的问题。同时,本发明通过基于二维数据的三维重建技术,从现有的情绪丰富的二维数据集得到近似数据,能够解决缺乏数据的问题。本发明侧重在生成人物形象视频的同时提高其表达的情绪化能力。通过在保证传播内容的同时,赋予视频中的人物与传播内容向匹配的情绪张力,使得视频人物表达更具情感特征,提高虚拟形象真实性,从而提高用户体验。
-
公开(公告)号:CN119569050A
公开(公告)日:2025-03-07
申请号:CN202411588518.1
申请日:2024-11-08
Applicant: 广东工业大学
IPC: C01B32/225 , H01G11/32
Abstract: 本发明属于碳素材料技术领域,具体涉及一种膨胀石墨及其制备方法。为改善膨胀石墨目前应用于超级电容器时展示的电化学性能,本发明先利用硝酸钠、浓硫酸和高锰酸钾对废旧石墨进行油浴加热处理,再利用双氧水进行氧化插层处理,获得天然鳞片石墨,然后经洗涤、干燥将其处理成氧化石墨后,最后进行高温膨化处理,得到膨胀石墨。采用本发明方法制备得到的膨胀石墨,以其作为超级电容器的电极材料,所组装的超级电容器表现出优异的比电容,并且表现出优异的长循环性能,循环10000圈后,容量保持率大于80%。
-
公开(公告)号:CN118015522B
公开(公告)日:2024-09-24
申请号:CN202410336432.3
申请日:2024-03-22
Applicant: 广东工业大学
IPC: G06V20/40 , G06F16/34 , G06V10/62 , G06V10/764 , G06V10/70
Abstract: 本发明涉及计算机图像处理和机器学习领域,更具体,用于视频场景图生成的时间过渡正则化方法和系统,本发明创建以图像的类别和上下文为条件的转换矩阵,以捕获基于每个类别的统计相关性以及基于每个上下文图像的细粒度相关性,并以显式方式将这些相关性合并到当前的VidSGG算法中,以提供更强、更细粒度的正则化,本发明着重解决视频中时间相关性的建模和利用,以提升人工智能对视频内容语义分析性能,在高风险领域,如自动驾驶和医疗诊断中,本发明可以提供更准确的场景图生成,有助于提高决策的可信度。
-
公开(公告)号:CN117935030A
公开(公告)日:2024-04-26
申请号:CN202410336507.8
申请日:2024-03-22
Applicant: 广东工业大学
IPC: G06V10/98 , G06N3/0499 , G06N3/0985 , G06V10/74 , G06V10/762 , G06V10/764 , G06V10/82
Abstract: 本发明公开了一种双视角相关性感知正则化的多标签置信度校准方法,包括:首先进行特定类别对比学习;其次进行实例级相关性感知正则化;然后进行原型级相关感知正则化;最后计算实例级相关性感知正则化平滑后的标签和原型级相关性感知正则化平滑后的标签的损失函数,并结合样本总损失计算得到置信度。本发明通过学习类别相关性来建模语义混淆,引入双重视角的相关性感知正则化,并将这些相关性引入到自适应正则化中,从而提高置信度的准确性,提高了计算机图像处理在高风险领域的实用性。
-
公开(公告)号:CN116012569B
公开(公告)日:2023-08-15
申请号:CN202310299402.5
申请日:2023-03-24
Applicant: 广东工业大学
Abstract: 本发明提供一种基于深度学习的含噪数据下的多标签图像识别方法,包括获取多标签含噪数据集并进行预处理;建立双分支多标签修正神经网络模型;将预处理后的多标签含噪数据集输入双分支多标签修正神经网络模型中进行对比学习训练,获得优化后的双分支多标签修正神经网络模型;获取待修正的含噪图片,利用优化后的双分支多标签修正神经网络模型对待修正的含噪图片进行修正,根据修正标签对待修正的含噪图片进行图像识别;本发明能够对多标签含噪数据集进行标签修正,节省人力物力成本,实现对数据资源的高效利用;同时预测结果更具有鲁棒性;另外,本发明根据对训练图片的预测值规定了上下界,能够减弱噪声,避免对噪声的过拟合。
-
公开(公告)号:CN117935030B
公开(公告)日:2024-10-25
申请号:CN202410336507.8
申请日:2024-03-22
Applicant: 广东工业大学
IPC: G06V10/98 , G06N3/0499 , G06N3/0985 , G06V10/74 , G06V10/762 , G06V10/764 , G06V10/82
Abstract: 本发明公开了一种双视角相关性感知正则化的多标签置信度校准方法,包括:首先进行特定类别对比学习;其次进行实例级相关性感知正则化;然后进行原型级相关感知正则化;最后计算实例级相关性感知正则化平滑后的标签和原型级相关性感知正则化平滑后的标签的损失函数,并结合样本总损失计算得到置信度。本发明通过学习类别相关性来建模语义混淆,引入双重视角的相关性感知正则化,并将这些相关性引入到自适应正则化中,从而提高置信度的准确性,提高了计算机图像处理在高风险领域的实用性。
-
公开(公告)号:CN118172452A
公开(公告)日:2024-06-11
申请号:CN202410604983.3
申请日:2024-05-15
Applicant: 广东工业大学
IPC: G06T13/20 , G06T13/40 , G06N3/0455 , G06N3/0475 , G06N3/094
Abstract: 本发明涉及计算机视觉技术领域,公开了一种基于时间相关性的头部动画生成方法及装置,方法包括利用音频和视频片段提取特征向量并计算它们的时间相关性,建立对应的协方差矩阵训练头部动画生成模型,利用通道注意力机制单元对视频特征向量和音频协方差矩阵进行增强处理,得到特征增强网络输入已训练好的头部动画生成模型,生成头部动画。本发明通过构建音频协方差矩阵和视频协方差矩阵来细致地分析音视频之间的时间同步性,能够有效地捕捉并利用音频和视觉内容之间的时序关联,改善了音频驱动的头部动画生成,提供了更加流畅和真实的视觉表现,从而提高动画的真实性和自然度。
-
-
-
-
-
-
-
-
-