-
公开(公告)号:CN114239799B
公开(公告)日:2025-05-02
申请号:CN202111464007.5
申请日:2021-12-03
Applicant: 上海交通大学
IPC: G06V10/25 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/045 , G06N3/082 , G06N3/096
Abstract: 本发明提供一种高效目标检测方法,包括:获取目标检测训练集;将所述训练集用于目标检测网络的预训练,得到全精度目标检测网络;自动调整所述目标检测网络的精度和参数,获得指定压缩率下的混合精度目标检测网络;采用所述混合精度目标检测网络对待检测图像进行处理,得到图像检测结果。本发明能基于给定的图像数据,自动调整设计目标检测网络的参数,减少模型大小,无需繁杂的人为设计,能够在不同的计算和存储资源下,自适应的调整模型大小,同时实现较高的图像检测准确率,保证了图像检测方法的稳定性和实用性。
-
公开(公告)号:CN114501013B
公开(公告)日:2025-04-29
申请号:CN202210042520.3
申请日:2022-01-14
Applicant: 上海交通大学
IPC: H04N19/146 , H04N19/109 , H04N19/11 , H04N19/124 , H04N19/31 , H04N19/91 , G06T9/00 , G06V20/40 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 本发明提供可变码率视频压缩方法、系统、装置及存储介质,包括:将参考帧图像通过卷积神经网络,得到参考帧的第一特征图,通过尺度缩放及可导量化得到参考帧的第二特征图,并进行逆缩放,得到重构的参考帧。将预测帧图像通过卷积神经网络,得到预测帧的第一特征图,通过尺度缩放及量化得到预测帧的第二特征图。将预测帧的第二特征图与参考帧的第二特征图相减,得到特征图残差;利用参考帧的第二特征图作为先验信息,对特征图残差进行无损熵编码,并传输至解码端;将特征图残差与参考帧的第二特征图相加并逆缩放后,通过卷积神经网络得到重构的预测帧。本发明利用尺度因子将特征图进行尺度缩放,从而得到不同码率质量对应的特征图。
-
公开(公告)号:CN119761530A
公开(公告)日:2025-04-04
申请号:CN202411789972.3
申请日:2024-12-06
Applicant: 上海交通大学
Abstract: 本公开提供一种采用全局方差缩减策略的联邦学习方法、装置及系统,其中,方法,应用于客户端,包括:接收服务器端发送的全局模型;根据全局模型对本地模型初始化;将本地训练数据输入经过初始化的本地模型,进行模型训练,确定经过模型训练的本地模型和本地模型的损失函数;根据本地模型的损失函数,基于反向传播对经过模型训练的本地模型进行更新处理;在更新处理的次数达到预设阈值时,确定本通信轮次的本地模型改变量;根据本通信轮次的本地模型改变量,确定本地模型改变量的差异量。通过本公开,在客户端计算本地模型改变量的差异量,保护客户端的数据隐私,减少客户端导致的模型方差,提高全局模型的收敛速率和泛化表现。
-
公开(公告)号:CN119011858A
公开(公告)日:2024-11-22
申请号:CN202411009925.2
申请日:2024-07-26
Applicant: 上海交通大学
IPC: H04N19/42 , H04N19/59 , H04N19/91 , H04N19/124
Abstract: 本发明公开一种面向机器视觉的图像编码、解码和压缩方法及系统,包括:通过空频调制编码网络获得待编码图像的第一特征图;将所述第一特征图中的每个特征值量化为整数,得到第二特征图;将所述第二特征图的分布参数化建模为高斯分布,采用熵模型预测高斯分布的均值、方差;根据预测的所述高斯分布的均值、方差对第二特征图的特征进行概率估计,根据估计概率进行算术编码,获得压缩图像二进制码流。本发明可以高效提取面向机器视觉的下游任务更为需要的信息,减少对于机器视觉冗余的信息,能够降低图像压缩码率开销的同时,有效提升下游任务的精确度,且能够运用于现有的任一端到端图像压缩编解码网络和熵模型网络。
-
公开(公告)号:CN117935325A
公开(公告)日:2024-04-26
申请号:CN202311144296.X
申请日:2023-09-06
Applicant: 上海交通大学
IPC: G06V40/16 , G06V40/40 , G06V10/774 , G06V10/82 , G06N3/0475 , G06N3/045
Abstract: 本公开提供一种无监督域泛化的人脸防伪方法、系统、介质及电子设备,其中人脸防伪方法包括:获取标记域索引的人脸图像训练集;根据当前人脸图像样本的增强特征与同一域索引下的人脸图像样本的增强特征之间的特征相似度,确定第一正样本;根据当前人脸图像的域归一化特征与不同域索引下的人脸图像样本的域归一化特征之间的特征相似度,确定第二正样本;采用人脸图像训练集对预设的无监督孪生网络进行模型训练处理,确定无监督孪生网络模型;将目标人脸图像输入无监督孪生网络模型中,确定目标人脸图像的人脸防伪特征。通过本公开,有效提升无监督网络模型的防伪性能,提高泛化性,实现低成本高鲁棒性的人脸防伪识别。
-
公开(公告)号:CN117853715A
公开(公告)日:2024-04-09
申请号:CN202211196141.6
申请日:2022-09-29
Applicant: 上海交通大学
IPC: G06V10/26 , G06V10/25 , G06V10/74 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/048 , G06N3/08 , G06N3/0464
Abstract: 本发明提供一种基于旋转等变性的图卷积层的球形图像分类与分割方法及系统,其主要基于球形图,采用注意力机制获得具有旋转等变性的图卷积层;基于所述图卷积层,设计具有旋转不变性的球形图像分类框架;基于所述图卷积层,设计具有旋转等变性的球形图像分割框架。本发明构造过渡层实现了具有旋转不变性的球形图像分类;基于Unet框架实现了具有旋转等变性的球形图像分割。该球形图像分类方法与分割方法分别具有良好的实用性和扩展性,能够对旋转的图像具有很强的特征提取能力和识别能力。
-
公开(公告)号:CN117692644A
公开(公告)日:2024-03-12
申请号:CN202211030945.9
申请日:2022-08-26
Applicant: 上海交通大学
IPC: H04N19/146 , H04N19/154 , H04N19/192 , H04N21/2343 , H04N21/238 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种基于上下文强化学习的码率自适应方法及控制器构建方法,包括:构建以网络吞吐上下文信息为输入、当前网络动态隐变量表示为输出的网络动态编码器;构建以用户端信息和所述当前网络动态隐变量表示为输入、当前视频切片的最优码率版本为输出的码率自适应元策略网络;对所述网络动态编码器和码率自适应元策略网络组成的全局模型通过行为克隆方法进行预训练、利用基于互信息正则化的近端策略优化方法进行再训练;获得最优神经网络参数,基于异构的用户端,对神经网络参数微调,获得码率自适应控制器。本发明能够快速自适应异构用户的本地网络带宽环境,从而最大化用户的整体观看体验质量,提高了网络视频流传输的带宽利用率和鲁棒性。
-
公开(公告)号:CN111160436B
公开(公告)日:2023-04-21
申请号:CN201911330871.9
申请日:2019-12-20
Applicant: 上海交通大学
IPC: G06V10/764 , G06V10/82 , G06V10/46 , G06V10/44 , G06V20/20 , G06N3/042 , G06N3/0464 , G06N3/048
Abstract: 本发明公开了一种旋转等变的图卷积神经网络的球形图像分类方法及系统,该方法包括:利用测地线二十面体采样方式构建球形图,利用构建的球形图表示球形图像;利用切比雪夫多项式滤波器构建具有旋转等变性质的图卷积层,对球形图进行图卷积;利用细分构图逆操作的池化层保持旋转等变性,对经过图卷积后的球形图进行图池化;利用基于图节点的均值及方差统计的过渡层,对经过图池化后的球形图的节点上的信号值进行统计,以通过全连接层对信号统计值进行处理进而对球形图像进行分类。该系统包括:依次连接的球形图构建模块、图卷积模块、图池化模块及图过渡模块。通过本发明,提高了对旋转图像的特征提取能力和识别能力,具有良好的实用性和扩展性。
-
公开(公告)号:CN115565231A
公开(公告)日:2023-01-03
申请号:CN202211271064.6
申请日:2022-10-17
Applicant: 上海交通大学
Abstract: 本发明提供一种隐私保护的人脸防伪方法和系统,将预训练的人脸防伪模型迁移到用户端,包括:获得可泛化的预训练人脸防伪模型,作为第一模型;将用户端人脸图像输入第一模型,产生第一伪标签;将第一模型作为初始化迭代更新得到第二模型;将第一模型的分类器权重特征,与第二模型输出的特征进行条件分布对齐;将用户端人脸图像分块并打乱顺序,以第一模型作为初始化,以乱序的人脸图像块迭代得到第三模型;结合第三模型和对齐后的人脸图像特征更新第二模型,用于用户端人脸防伪。本发明在保护人脸隐私没有预训练数据的情况下,将预训练好的人脸防伪模型迁移到用户端上进行使用,有效地提高用户在真实世界的不同环境下使用人脸防伪模型的准确率。
-
公开(公告)号:CN113115077B
公开(公告)日:2022-04-26
申请号:CN202110269265.1
申请日:2021-03-12
Applicant: 上海交通大学
IPC: H04N21/238
Abstract: 本发明公开了一种静态点云服务器端码率自适应传输方法及系统,该方法包括:服务器端将静态点云划分为3D空间切片;用户端将用户观看信息以及显示屏幕分辨率实时反馈给服务器端,并从服务器端下载可分配给每个3D空间切片的码率版本全集;服务器端根据用户观看信息以及显示屏幕分辨率计算出每一个空间切片的QoE贡献;并采用空间切片组成的全集、空间切片的码率版本全集、网络资源限制、每一个空间切片的QoE贡献,建立基于空间切片的码率自适应分配的优化问题,得到最优空间切片码率版本子集。系统包括:用户端、服务器端,对应实现上述功能。通过本发明,提高了静态点云传输的带宽利用率,为用户提供更好的质量体验。
-
-
-
-
-
-
-
-
-