-
公开(公告)号:CN111355949B
公开(公告)日:2021-05-25
申请号:CN202010172382.1
申请日:2020-03-12
Applicant: 上海交通大学
IPC: H04N17/00 , H04N21/234 , H04N21/233 , H04N21/44 , H04N21/439 , H04N21/475
Abstract: 本发明提供了一种音视频多媒体数据库的构建及多媒体主观质量评价方法,通过创建专门用于音频及视频多媒体的联合质量主观评价音视频多媒体数据库,并基于该数据库,通过搭建音视频多媒体质量评价环境以及选择训练用音视频多媒体数据库中的数据对测试者进行训练、对从测试用音视频多媒体数据库中选择待测试数据进行测试以及对测试得到的主观质量评价结果进行后期数据处理,实现规范化及流程化的音视频多媒体主观质量评价。
-
公开(公告)号:CN109635705B
公开(公告)日:2021-04-27
申请号:CN201811483176.1
申请日:2018-12-05
Applicant: 上海交通大学
Abstract: 本发明公开了一种基于二维码和深度学习的商品识别方法及装置,该方法包括:编码制作二维码标签,并给部分商品贴上二维码标签;对未贴二维码标签的特定商品进行拍摄,得到特定商品的图片,利用深度神经网络对特定商品的图片进行训练得到神经网络模型;利用训练得到的神经网络模型对商品进行检测,识别出特定商品信息;利用二维码标签识别出贴有二维码标签的商品信息。该装置包括:摄像机、神经网络识别装置以及二维码识别装置。本发明的基于二维码和深度学习的商品识别方法及装置,通过二维码和深度学习相组合的方案,提高了商品识别效率、降低了成本。
-
公开(公告)号:CN112107457A
公开(公告)日:2020-12-22
申请号:CN202011002311.3
申请日:2020-09-22
Applicant: 上海交通大学医学院附属第九人民医院
Abstract: 本申请提供的一种智能张口康复器,包括:主体,其一端设有上咬合垫与下咬合垫;所述上咬合垫和/或下咬合垫内设有压力传感器,用于采集使用时患者口腔上颌和/或下颌的压力数据;步进电机,用于驱动所述上咬合垫和/或下咬合垫的纵向摆动;处理器,用于依据所述压力数据和/或预先设定的训练指令以使所述步进电机运行或停止,从而驱动所述上咬合垫和/或下咬合垫的纵向摆动或停止。目前的开口康复器每次使用需要人工测量开口角度或开口距离和自行把握训练时长相比,本申请所述的智能张口康复器,不仅可以无需手动,自动实现上咬合垫与下咬合垫的开合,而且训练方式更加精准、科学、可控,能够大大提高康复效。
-
公开(公告)号:CN111938604A
公开(公告)日:2020-11-17
申请号:CN202010654996.3
申请日:2020-07-09
Applicant: 上海交通大学
Abstract: 本发明提供了一种基于多模态技术的呼吸系统疾病远程监控系统,包括集成成像模块、麦克风阵列模块和处理终端模块,集成成像模块包括集成的远红外热成像装置、可见光成像装置、近红外成像装置,处理终端模块根据远红外热成像装置的热成像图像提取人体的体温和呼吸速率,用于判断人体的发热、呼吸急促情况;处理终端模块根据可见光成像装置、近红外成像装置的成像图像识别人体的咳嗽动作,根据麦克风阵列模块的音频信息识别咳嗽声音,通过人体的咳嗽动作、咳嗽声音来综合判断咳嗽行为。本发明整合了成像模块和麦克风阵列模块,可以实现高精度的呼吸系统疾病典型特征信号提取和分析,满足对于呼吸系统疾病远程监控的应用需求。
-
公开(公告)号:CN111938567A
公开(公告)日:2020-11-17
申请号:CN202010655960.7
申请日:2020-07-09
Applicant: 上海交通大学
Abstract: 本发明提供了一种基于深度学习的人眼参数测量方法及系统,包括:获取人脸图片,并提取图片中左右眼图像;采用深度神经网络,识别左右眼图像中的不同位置,包括角膜、巩膜和内外眦位置;计算左右眼图像中的不同位置的多个眼部参数。同时提供了一种基于上述人眼参数测量方法及系统实现的设备。本发明提供的基于深度学习的人眼参数测量方法、系统及设备,能够实现人眼不同部位的自动识别和定位;实现眼科医生常需要测量的眼部参数的自动测量;为眼科医生实现对眼部病症情况的分析提供了参数辅助及支持。
-
公开(公告)号:CN111539420A
公开(公告)日:2020-08-14
申请号:CN202010171611.8
申请日:2020-03-12
Applicant: 上海交通大学
Abstract: 本发明提供了一种基于注意力感知特征的全景图像显著性预测方法及系统,包括:预测全景图像的前景注意力图和背景注意力图;计算预测的所述前景注意力图、所述背景注意力图中每一部分的逐像素的亮度值,得到可视化分数;提取全景图像的全局特征,将所述全局特征与预测的所述前景注意力图、所述背景注意力图使用逐元素乘的方式进行融合,得到融合后的所述前景注意力图、所述背景注意力图;将融合后的所述前景注意力图、所述背景注意力图与所述可视化分数加权融合,获得最终的预测结果。本发明在模拟人类视觉注意力机制方面具有较好的准确性。
-
公开(公告)号:CN111479108A
公开(公告)日:2020-07-31
申请号:CN202010172399.7
申请日:2020-03-12
Applicant: 上海交通大学
IPC: H04N17/00 , H04N21/234 , H04N21/233 , H04N21/44 , H04N21/439 , H04N21/475 , G06N3/04
Abstract: 本发明提供了一种基于神经网络的视频及音频联合质量评价方法,包括:从视频帧从截取适应神经网络输入的视频图像块,利用短时傅里叶变换将音频片段的一维音频信号转化为二维声谱图表征,利用神经网络分别从视频图像块及二维声谱图中提取感知质量特征,对提取的音视频深度神经网络感知质量特征进行一定后处理,得到两种模态基于深度神经网络的质量特征,融合两种模态的质量特征得到视频帧及音频片段的联合感知质量,在时域上池化视频帧及音频片段的联合感知质量得到总体音视频的联合感知质量。同时提供了一种联合质量评价装置。本发明提供的基于神经网络的视频及音频联合质量评价方法,可有效地评价音频和视频的总体体验质量。
-
公开(公告)号:CN111385567A
公开(公告)日:2020-07-07
申请号:CN202010172376.6
申请日:2020-03-12
Applicant: 上海交通大学
IPC: H04N17/00 , H04N21/234 , H04N21/44
Abstract: 本发明公开一种超高清视频质量评价方法及装置,方法包括:将超高清视频序列逐帧提取出图像序列,将图像从彩色图转变成灰度图;对转变后的每一帧灰度图进行分块,并计算每一分块的局部方差,选取局部方差最大的一个分块作为后续处理的子图,并记录该局部方差为图像复杂度特征;对所述子图进行离散余弦变换,计算所述离散余弦变换下的频域能量特征;计算所述子图的自然统计学特征;将上述图像复杂度特征、频域能量特征、自然统计学特征采用支持向量机方法融合,得到最终的视频质量评价质量分数。本发明可以有效地用于辨别真伪4K超高清图像视频序列,评价超高清图像的质量。
-
公开(公告)号:CN110890140A
公开(公告)日:2020-03-17
申请号:CN201911168168.2
申请日:2019-11-25
Applicant: 上海交通大学
Abstract: 本发明提供一种基于虚拟现实的自闭症康复训练及能力评估系统及方法,包括计算反馈主控设备和虚拟现实模块,虚拟现实模块受所述计算反馈主控设备控制,为自闭症患者模拟虚拟现实场景,引导自闭症患者与虚拟现实场景交互,通过虚拟现实技术并结合适当的内容能够将被测者的行为模式放大,并结合人工智能技术对数据进行分析处理,且能够对被测者的神经回路进行一定程度的模拟,而通过与标准对照组及自闭症对照组进行比对,可以得到综合的评估结果,并可以结合实时反馈和阶段反馈调整康复训练的内容及流程,自适应自闭症患者的当前状态。
-
公开(公告)号:CN107205155B
公开(公告)日:2019-09-27
申请号:CN201710375475.2
申请日:2017-05-24
Applicant: 上海交通大学
IPC: H04N19/467 , H04N21/8358
Abstract: 本发明公开了一种基于人眼视觉在空域上融合特性的二维码隐藏画面系统,所述预处理模块,对于目标视图和二维码进行灰度域上的最优解计算,结合人眼的连续采样和摄影设备的离散采样的特点,使得处理过的超高清视频图像在所述显示模块的高分辨率显示设备上播放时人眼看不到二维码而摄影设备能扫出二维码;所述输入模块,用于接收经过所述预处理模块处理过的超高清视频图像,并将所述超高清视频图像存入片外存储器;所述显示模块,用于从所述片外存储器读入所述超高清视频图像,在高分辨率显示设备上投影出处理过的超高清视频图像流。本发明能大幅规避二维码播放与正常视频播放的冲突。
-
-
-
-
-
-
-
-
-