-
公开(公告)号:CN119893158A
公开(公告)日:2025-04-25
申请号:CN202311393601.9
申请日:2023-10-25
Applicant: 腾讯科技(深圳)有限公司 , 上海交通大学
IPC: H04N21/234 , H04N21/44 , H04N21/439 , H04N21/233 , G06T5/50
Abstract: 本申请公开了一种全景视频处理方法、装置、电子设备及存储介质,该方法包括:获取待处理全景视频的全景视频帧序列和全景音频片段序列;对全景视频帧依序进行特征提取操作,该特征提取操作包括:对当前全景视频帧进行视觉特征提取,将视频特征提取结果与历史视觉状态进行融合得到当前全景视频帧的时空视觉特征,基于该时空视觉特征更新历史视觉状态;对各全景音频片段分别进行听觉特征提取得到对应的听觉特征;将各全景视频帧的时空视觉特征与相应听觉特征进行融合处理,得到对应的融合视听特征;基于每个全景视频帧的融合视听特征分别进行显著性预测得到对应的显著性分布图。本申请降低了显著性预测的计算资源消耗和时间开销,提高了预测准确性。
-
公开(公告)号:CN113935884B
公开(公告)日:2025-02-25
申请号:CN202111215940.9
申请日:2021-10-19
Applicant: 上海交通大学
IPC: G06F17/00
Abstract: 本发明提供了一种基于神经网络的不可见二维码嵌入、检测和修复方法,包括:利用非线性时间心理视觉调制技术将二维码嵌入视频中,使所述二维码不能被人眼观察到;从嵌入二维码后的所述视频中采集一组包含所述二维码的数据,利用第一神经网络定位数据中的所述二维码;利用第二神经网络对定位后的所述二维码进行校准,得到校准后的二维码;将所述校准后的二维码输入第三神经网络进行修复,得到修复后的二维码。本发明提供的基于神经网络的不可见二维码嵌入、检测和修复方法,可有效地提升不可见二维码嵌入质量和检测修复的效率。
-
公开(公告)号:CN113947524B
公开(公告)日:2024-11-01
申请号:CN202111230705.9
申请日:2021-10-22
Applicant: 上海交通大学
IPC: G06F30/27
Abstract: 本发明提供一种基于全卷积图神经网络的全景图片显著性预测方法及设备,包括:将平面全景图像映射成为球面的图数据;将所述球面的图数据输入到全卷积图神经网络进行显著性预测,得到球面显著性图数据;将所述球面显著性图数据变换到平面上,得到平面的全景显著性图像。进一步的,本发明全卷积图神经网络基于残差U形网络结构,在底部采用了膨胀图卷积和注意力机制。此外,本发明使用了一种新的全卷积层,用于球面图空间中的图池化和反池化操作,以保留节点到节点的特征。本发明提出的方法在大规模数据集上优于其他较为先进的显著性预测模型。
-
公开(公告)号:CN118053029A
公开(公告)日:2024-05-17
申请号:CN202410200633.0
申请日:2024-02-23
Applicant: 上海交通大学医学院附属第九人民医院
IPC: G06V10/764 , G06V10/762 , G06V10/40 , G06V10/26 , G06V10/56 , G06N20/00
Abstract: 本申请涉及一种图像分类方法,所述方法包括:获取皮瓣图像,对所述皮瓣图像进行聚类得到皮瓣部位及非皮瓣部位;提取所述皮瓣部位图像的图像灰度像素直线,其中所述图像灰度像素直线经过所述皮瓣图像;对所述图像灰度像素直线进行特征提取,并基于预训练的图像分类模型以及提取到的特征进行皮瓣图像的分类,所述皮瓣图像的类别包括正常皮瓣及危象皮瓣。基于本申请提供的方法可以实现对皮瓣图像类型的识别,提高识别效率与准确率。
-
公开(公告)号:CN117679058A
公开(公告)日:2024-03-12
申请号:CN202311816492.7
申请日:2023-12-26
Applicant: 上海交通大学医学院附属第九人民医院
Abstract: 本发明涉及一种口腔全景片图像重建方法及系统,该方法步骤包括:按照预定的轨迹扫描患者口腔,得到原始影像数据;对原始影像数据进行纠正;基于纠正后的影像数据提取口腔的轴向轮廓,基于口腔的轴向轮廓提取牙齿的中心点,对牙齿的中心点进行曲线拟合,得到牙弓曲线提取牙弓曲线;获取牙弓曲线上用于图像重建的采样点;基于采样点进行口腔全景片图像重建。与现有技术相比,本发明通过对影像数据的偏差进行纠正,在保证重建图像准确度的前提下降低了扫描时患者的位置偏差对图像带来的影响,并且通过对整个牙齿的侧面轮廓进行直线拟合得到口腔的侧面偏差直线,在后续处理时偏差角度误差较小,重建的口腔全景片更加准确。
-
公开(公告)号:CN117557481A
公开(公告)日:2024-02-13
申请号:CN202311341065.8
申请日:2023-10-16
Applicant: 上海交通大学
IPC: G06T5/90 , G06T7/00 , G06T7/90 , G06N3/0464
Abstract: 本发明提供了一种以质量为引导的人脸肤色连续可控增强方法、系统及终端,方法包括:提取人脸图像的肤色区域并进行肤色调整,通过图像质量评估模块获取调整后图像的质量分数,建立肤色图像质量评估数据库;建立基于三维查找表的图像增强网络;利用肤色图像质量评估数据库对图像增强网络进行训练,学习不同质量分数的图像的分布,获得图像增强模型;将待增强图像及目标质量分数共同输入图像增强模型,获得目标质量分数对应的增强图像,实现根据给定的质量分数对人脸肤色进行连续可控的调整。由此,本发明可以解决相关技术中只能获得固定增强结果而无法控制增强效果的问题。
-
公开(公告)号:CN117372550A
公开(公告)日:2024-01-09
申请号:CN202311338949.8
申请日:2023-10-17
Applicant: 上海交通大学
IPC: G06T7/90 , G06N3/045 , G06N3/0464
Abstract: 本发明提供一种图像对的色差预测方法、系统、终端及介质,包括:将基于RGB色彩空间中的一个原始图像对的两张图像转换为基于LAB和HSV色彩空间的两个图像对,获得基于LAB、RGB和HSV色彩空间的三个图像对;采用双流神经网络对所述三对图像对分别进行特征提取,获得每个图像的低级到高级特征图,并得到每个图像对的色差图;将所述色差图连接起来,通过色差计算获得每个色彩空间中的图像对的色差;对基于LAB、RGB和HSV色彩空间的三个图像对的色差进行平均池化,得到原始图像对的色差。本发明可有效地预测图像对的色差。
-
公开(公告)号:CN113628130B
公开(公告)日:2023-10-27
申请号:CN202110829947.3
申请日:2021-07-22
Applicant: 上海交通大学
IPC: G06T5/00 , G06N3/0464 , G06N3/048 , G06N3/082
Abstract: 本发明提供一种基于深度学习的视障辅助的图像增强方法、设备和介质,包括:将卷积神经网络的输出端与模拟视障患者的视觉系统的输入端进行连接,得到级联系统;对卷积神经网络进行训练得到图像增强网络,其中:将原始图像输入卷积神经网络进行增强,将增强结果输入模拟视障患者的视觉系统进行模拟,级联系统输出为该视障症状的模拟的感知图像;计算级联系统输出和原始图像的损失,以最小化级联系统的输入输出图像间的差异为目标,对原始图像进行增强以补偿模拟的视障患者的视觉系统带来的失真。本发明得到的图像增强网络能有效地实现针对视障辅助的图像增强,实验表明针对中心视力下降的图像增强能有效改善患者的视觉功能和主观感知质量。
-
公开(公告)号:CN116616706A
公开(公告)日:2023-08-22
申请号:CN202310521902.9
申请日:2023-05-10
Applicant: 上海交通大学医学院附属第九人民医院
Abstract: 本发明涉及一种皮瓣监测装置,包括第一移动机构,安装在医疗床的护栏上;第二移动机构,安装在第一移动机构上,包括滑动块;转换机构,安装在滑动块上;监测机构,安装在第二移动机构上,包括连接块、第一伸缩杆、固定块、红外测温器、摄像头和皮瓣压迫装置,连接块固定安装在所述转换机构的输出端,第一伸缩杆安装在连接块的一端,固定块安装在第一伸缩杆的输出端,固定块上安装有红外测温器、摄像头和皮瓣压迫装置;控制面板,分别与第一移动机构、第二移动机构、转换机构和监测机构电连接。本发明能够实现对皮瓣术后的外观、温度和毛细血管回流情况进行监测,数据更具参考意义;并且还能利用烤灯为皮瓣区域进行加热,集成多种功能。
-
公开(公告)号:CN116364292A
公开(公告)日:2023-06-30
申请号:CN202310335253.3
申请日:2023-03-31
Applicant: 上海交通大学医学院附属第九人民医院
IPC: G16H50/50 , G16H50/30 , G16H30/40 , G06V10/82 , G06V10/80 , G06V10/764 , G06V40/16 , G06N3/0455 , G06N3/0464 , G06N3/047 , G06N3/048 , G06N3/084
Abstract: 本发明公开了一种甲状腺眼病的预后预测方法,包括:获取历史医疗数据和面部图像数据;对检测数据进行预处理,将不同数据类型的所述检测数据进行特征嵌入生成嵌入特征向量;将同一待预测对象多个检测时间点获得的所述嵌入特征向量集合生成待预测时间序列数据;基于Transformer构建预后预测模型,将所述待预测时间序列数据输入训练后的所述预后预测模型,对未来检测时的甲状腺功能检测指标进行预测。采集大量TED患者面部图像及甲状腺功能检测数据,无创性预测甲状腺功能的异常情况,借助人工智能神经网络训练来达到预测其关键功能指标的目的,进而协助医生和患者对预后眼部健康情况进行评估和监测,实现甲状腺相关眼病筛查的目的,节省了大量成本。
-
-
-
-
-
-
-
-
-