-
公开(公告)号:CN119991573A
公开(公告)日:2025-05-13
申请号:CN202411986262.X
申请日:2024-12-31
Applicant: 北京大学深圳研究生院
IPC: G06T7/00 , G06T5/50 , G06T3/4038 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本申请公开了一种文本驱动的图像编辑质量评价方法、设备及存储介质,涉及人工智能技术领域,所述的方法包括:将源图像的第一图像特征和编辑图像的第二图像特征,输入至源图像与编辑图像交互模块进行源图像和编辑图像的联系确认,得到图像联系得分;将第二图像特征,输入至原生质量评价模块进行所述编辑图像的质量评价,得到编辑质量得分;将编辑文本的文本特征和编辑图像的第三图像特征,输入至多模态注意力交互模块进行文本和图像的一致性确认,得到文本一致性得分;基于图像联系得分、编辑质量得分和文本一致性得分,得到图像编辑质量得分。本申请从多维度进行图像编辑质量得分,能更全面、准确地反映图像编辑的实际效果。
-
公开(公告)号:CN113574566B
公开(公告)日:2025-05-09
申请号:CN202180001203.0
申请日:2021-05-14
Applicant: 北京大学深圳研究生院
IPC: G06V10/774 , G06V10/82 , G06V10/46
Abstract: 本申请公开了一种目标检测网络构建优化方法,所述目标检测网络构建优化方法包括:获取高质量可视媒体数据及其对应的低质量可视媒体数据以及对应的真实标签,分别提取预设先验网络针对于高质量可视媒体数据的第一主干网侧面输出特征以及提取预设待训练目标检测网络针对于低质量可视媒体数据的第二主干网侧面输出特征;基于所述第一主干网侧面输出特征、所述第二主干网侧面输出特征和所述真实标签,构建特征相关性损失、显著目标位置损失以及显著性预测损失;基于所述特征相关性损失、所述显著性目标位置损失以及所述显著性预测损失,优化所述预设待训练目标检测网络,获得目标检测网络。本申请解决了显著性目标检测网络检测精度低的技术问题。
-
公开(公告)号:CN114359162B
公开(公告)日:2025-04-25
申请号:CN202111507286.9
申请日:2021-12-10
Applicant: 北京大学深圳研究生院
Abstract: 本发明公开了一种显著性检测方法、显著性检测设备和计算机可读存储介质,所述方法包括:确定第一主干网络第一目标卷积层的第一输出结果,以及第二主干网络第二目标卷积层的第二输出结果;根据所述第一输出结果确定所述第一全局描述子,以及根据所述第二输出结果确定第二全局描述子;根据所述第一全局描述子和所述第二全局描述子确定各个模态的不同通道的重要性;根据所述重要性以及所述第一输出结果确定第一模态特征,以及根据所述重要性和所述第二输出结果确定第二模态特征;基于所述第一模态特征和所述第二模态特征确定显著性检测结果。本发明旨在达成提升显著检测结果的鲁棒性的效果。
-
公开(公告)号:CN115278257B
公开(公告)日:2025-01-14
申请号:CN202210897615.3
申请日:2022-07-28
Applicant: 北京大学深圳研究生院
IPC: H04N19/189 , H04N19/119 , G06T9/00 , G06N3/045 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本申请涉及图像处理技术领域,尤其涉及一种图像压缩方法、装置、电子设备及存储介质。本申请先将获取到的原始图像进行切割得到多个区域图像,并分别确定各个区域图像在图像压缩过程中所需的有效通道的通道数量,进而,通过将原始图像以及原始图像的各个区域图像分别对应的通道数量输入训练好的空域自适应压缩自编码器,得到所述原始图像经由神经网络变换后的目标潜在表示和目标重建图像。本申请通过空域自适应压缩自编码器对原始图像的各个区域图像分别按照各自适配的特征通道数进行图像压缩,可以在保证解压缩后的目标重建图像满足一定质量前提下,显著提升图像压缩过程中的计算效率,可以同时兼顾失真度和编码开销的联合优化。
-
公开(公告)号:CN119254970A
公开(公告)日:2025-01-03
申请号:CN202411331325.8
申请日:2024-09-24
Applicant: 北京大学深圳研究生院
IPC: H04N19/136 , H04N19/146 , H04N19/184
Abstract: 本申请公开了一种视频处理方法、设备、存储介质及计算机程序产品,涉及视频编解码技术领域,包括:获取输入视频,确定输入视频的各视频帧在各编码路径的比特率;根据视频帧在各编码路径的比特率,确定视频帧的目标编码路径;基于目标编码路径对视频帧进行编码,生成视频帧对应的第一特征集;压缩各视频帧对应的第一特征集,生成各视频帧对应的压缩比特流。本申请根据视频帧的码率,自适应选择合适的编解码路径,保证视频的压缩效率的同时,提高压缩质量。
-
公开(公告)号:CN114359892B
公开(公告)日:2024-10-29
申请号:CN202111502649.X
申请日:2021-12-09
Applicant: 北京大学深圳研究生院
IPC: G06V20/64 , G06V10/40 , G06V10/774
Abstract: 本发明公开了一种三维目标检测方法、装置及计算机可读存储介质,所述方法包括:采用目标检测模型的语义提取模块提取待检测图像的图像语义特征;根据所述目标检测模型的检测模块,对所述图像语义特征以及所述待检测图像进行预测,得到所述待检测图像的二维框信息以及中间三维框信息;通过所述检测模块对所述二维框信息以及所述中间三维框信息进行检测,得到三维目标框信息,其中,所述目标检测模型包括依次连接的所述语义提取模块以及所述检测模块。本发明旨在提高检测图像中三维目标的准确性。
-
公开(公告)号:CN111951203B
公开(公告)日:2024-10-29
申请号:CN202010623644.1
申请日:2020-07-01
Applicant: 北京大学深圳研究生院
IPC: G06T5/50 , G06T3/4076 , G06N3/08 , G06N3/0464 , G06T3/4046
Abstract: 本发明公开了一种视点合成方法、装置、设备及计算机可读存储介质,该方法包括以下步骤:获取多个输入图像,并将输入图像输入至压缩分辨率网络,以对输入图像执行压缩分辨率操作,得到中间图像;将中间图像输入至视点合成网络,得到视点合成图;将视点合成图输入至超分辨率网络,以对视点合成图执行分辨率重建操作,输出高分辨率的目标视点合成图,其中,压缩分辨率网络与所述超分辨率网络的网络结构对称。本发明通过压缩分辨率网络和超分辨率网络降低视点合成数据的运算量,从而减少计算机系统的计算量,提升计算机运算效率,解决了计算机系统进行视点合成的计算效率较低的技术问题。
-
公开(公告)号:CN111968040B
公开(公告)日:2024-07-26
申请号:CN202010629797.7
申请日:2020-07-02
Applicant: 北京大学深圳研究生院
IPC: G06T5/70 , G06N3/08 , G06N3/0464 , G06F7/58
Abstract: 本发明公开了一种图像的复原方法、系统及计算机可读存储介质,该方法的步骤包括:获取待处理图像,并获取第一评估网络和随机数发生器,基于第一评估网络和随机数发生器确定待处理图像对应的复原工具;通过复原工具对待处理图像进行处理,得到对应的处理结果,并基于处理结果确定第二评估网络;基于第二评估网络和随机数发生器确定图像复原路径,并通过图像复原路径复原待处理图像。本发明基于第一评估网络和随机数发生器确定待处理图像对应的复原工具,通过复原工具对待处理图像进行处理,基于处理结果确定第二评估网络,基于第二评估网络和随机数发生器确定图像复原路径,并通过图像复原路径复原待处理图像,从而提升了图像复原的效率。
-
公开(公告)号:CN118247642A
公开(公告)日:2024-06-25
申请号:CN202410300586.7
申请日:2024-03-15
Applicant: 北京大学深圳研究生院
IPC: G06V10/98 , G06V10/44 , G06V10/82 , G06V10/74 , G06F18/213 , G06F18/22 , G06N3/0455 , G06N3/08
Abstract: 本发明提出一种AI图像的图像质量测算方法、系统、设备及存储介质,应用于图像处理技术领域,方法包括:获取待测算AI图像和待测算AI图像的生成图像所用文本;基于预设的图像编码器提取待测算AI图像的图像特征,并基于预设的文本编码器提取生成图像所用文本的文本特征;将图像特征输入预设的注意力池化模型,得到全局图像特征,并将图像特征和文本特征输入预设的跨模态注意力池化模型,得到图文匹配特征;根据全局图像特征和图文匹配特征,得到待测算AI图像的图像质量。本发明技术方案旨在解决如何准确地测算AI生成图像的图像质量的技术问题。
-
公开(公告)号:CN118134849A
公开(公告)日:2024-06-04
申请号:CN202410140400.6
申请日:2024-01-31
Applicant: 北京大学深圳研究生院
IPC: G06T7/00 , G06V10/44 , G06V10/82 , G06V10/74 , G06N3/0464
Abstract: 本发明涉及点云数据处理技术领域,公开了一种点云质量评估方法、装置、设备及存储介质,该方法包括:获取失真点云在若干个视点距离对应的点云投影图像;通过预设特征提取分支网络对点云投影图像进行特征提取,获得点云投影图像特征;确定点云投影图像特征对应的特征质量分数;基于特征质量分数确定失真点云的预测质量分数,以获得失真点云的质量评估结果。本发明获得失真点云在若干个视点距离对应的点云投影图像对应的点云投影图像特征,并基于点云投影图像特征对应的特征质量分数确定失真点云的预测质量分数,以获得质量评估结果,解决了现有技术中的主观评分方式通常无法对点云质量进行准确评估,进而影响基于点云的应用技术的技术问题。
-
-
-
-
-
-
-
-
-