-
公开(公告)号:CN119296400A
公开(公告)日:2025-01-10
申请号:CN202411130743.0
申请日:2024-08-16
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明公开了基于VR头显设备的多场景半同步虚拟教室方法,包括:读取虚拟教室初始界面,并建立教师端与学生端之间的课件连接,进入预设虚拟教室场景;建立所述教师端与所有学生端之间的通信连接,并根据选择的座位锚点调整对应学生端的座位及视角;获取所述教师端中的授课文件,并根据预设数据库的函数对所述授课文件进行转换,并将转换后的授课文件显示在所述预设虚拟教室场景的指定位置;获取所述教师端或当前学生端的语音信息,并对获取的语音信息进行转换,将转换的语音信息传输到其他端,实现虚拟教室的语音互动。本发明实现了教室场景多样化、教学语音互动、授课PPT课件展示以及座位视角切换的虚拟教室教学场景下的个性化需求。
-
公开(公告)号:CN118042133B
公开(公告)日:2024-06-28
申请号:CN202410436958.9
申请日:2024-04-12
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: H04N19/124 , H04N19/174 , H04N19/132 , G06T9/00
Abstract: 本发明公开一种基于切片表达的全景图像编码方法、解码方法及相关装置,涉及全景图像编解码领域,方法包括以下步骤:对获取的待编码全景图像进行超级切片图像转换,得到超级切片图像集合作为全景图像的切片化表达形式,利用切片编码器对超级切片图像集合进行特征提取,得到超级切片编码,进一步生成超级切片编码量化结果和先验编码量化结果,据此确定高斯分布概率模型,并利用该模型生成超级切片编码量化结果的比特流和先验编码量化结果的比特流;而在解码阶段,对超级切片编码量化结果的比特流进行解码,并将解码结果经过反量化以及切片解码后,得到全景重构图像,提高了全景图像表达的稳定性,实现了高性能的全景图像编解码。
-
公开(公告)号:CN118042133A
公开(公告)日:2024-05-14
申请号:CN202410436958.9
申请日:2024-04-12
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: H04N19/124 , H04N19/174 , H04N19/132 , G06T9/00
Abstract: 本发明公开一种基于切片表达的全景图像编码方法、解码方法及相关装置,涉及全景图像编解码领域,方法包括以下步骤:对获取的待编码全景图像进行超级切片图像转换,得到超级切片图像集合作为全景图像的切片化表达形式,利用切片编码器对超级切片图像集合进行特征提取,得到超级切片编码,进一步生成超级切片编码量化结果和先验编码量化结果,据此确定高斯分布概率模型,并利用该模型生成超级切片编码量化结果的比特流和先验编码量化结果的比特流;而在解码阶段,对超级切片编码量化结果的比特流进行解码,并将解码结果经过反量化以及切片解码后,得到全景重构图像,提高了全景图像表达的稳定性,实现了高性能的全景图像编解码。
-
公开(公告)号:CN117876430B
公开(公告)日:2024-06-18
申请号:CN202410281592.2
申请日:2024-03-13
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06T7/246 , G06T7/73 , G06N3/0464 , G06N3/084 , G06V20/40
Abstract: 本发明公开了一种全景图像及视频中的扫视路径预测方法、设备及介质,涉及扫视路径预测技术领域,方法包括:获取历史扫视路径下的全景图像及视频;采用图像转化方法,将全景图像及视频转为视口序列;将注视位置序列投影到与每一注视位置对应的视口中,得到每一视口中历史路径的相对坐标;将视口序列、每一视口的相对坐标以及自回归路径先验坐标输入至高斯混合模型,并使用基于物理模型和梯度下降优化器的随机采样模型预测下一时刻之后的扫视路径;本发明将视口序列、每一视口的历史路径相对坐标序列以及自回归路径先验坐标输入至高斯混合模型,实现对下一时刻扫视路径的预测,提高了扫视路径预测的准确性。
-
公开(公告)号:CN117876430A
公开(公告)日:2024-04-12
申请号:CN202410281592.2
申请日:2024-03-13
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06T7/246 , G06T7/73 , G06N3/0464 , G06N3/084 , G06V20/40
Abstract: 本发明公开了一种全景图像及视频中的扫视路径预测方法、设备及介质,涉及扫视路径预测技术领域,方法包括:获取历史扫视路径下的全景图像及视频;采用图像转化方法,将全景图像及视频转为视口序列;将注视位置序列投影到与每一注视位置对应的视口中,得到每一视口中历史路径的相对坐标;将视口序列、每一视口的相对坐标以及自回归路径先验坐标输入至高斯混合模型,并使用基于物理模型和梯度下降优化器的随机采样模型预测下一时刻之后的扫视路径;本发明将视口序列、每一视口的历史路径相对坐标序列以及自回归路径先验坐标输入至高斯混合模型,实现对下一时刻扫视路径的预测,提高了扫视路径预测的准确性。
-
公开(公告)号:CN115758281A
公开(公告)日:2023-03-07
申请号:CN202211346336.4
申请日:2022-10-31
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F18/25 , G06F18/213 , G06F18/241 , G16H10/60 , G16H30/20 , G16H50/20
Abstract: 本发明公开了一种中医多模态诊察信息的融合方法及相关设备,所述方法包括:获取多个模态诊疗数据,将各模态诊疗数据分解为共有信息和各模态内部的独有信息;基于解纠缠策略,将多个模态之间的共有信息为与各模态的独有信息视为不同的类别,在新的投影空间内通过分类器以充分学习不同模态的独有信息;将学习所得共有信息与独有信息进行串联得到融合特征,并通过分类与多次优化迭代,增强融合特征对病症的表示效果。本发明将多模态诊疗数据分解为共有信息和独有信息,通过解纠缠策略,设计约束函数与分类模型,增强独有信息与公共信息,将共有信息和独有信息串联,并通过分类与多次优化迭代,进一步增强独有信息与公共信息,实现了良好的多模态特征表示效果。
-
公开(公告)号:CN107481295A
公开(公告)日:2017-12-15
申请号:CN201710691448.6
申请日:2017-08-14
Applicant: 哈尔滨工业大学
IPC: G06T9/00
Abstract: 基于动态字节长度分配的卷积神经网络的图像压缩系统,属于图像压缩技术领域。所述图像压缩系统:字节长度分配图网络将卷积码编码器的中间特征,即字节长度特征,作为其输入,建立基于待压缩图像内容的字节长度分配图,并根据该字节长度分配图建立字节长度分配图模板。二值器将卷积码编码器输出的初步编码特征图转换为编码二值特征图,即离散编码。在进入卷积熵编码器之前,所述离散编码先与字节长度分配图模板进行点乘裁剪。因此,对于本发明所述的图像压缩系统,其待熵编码的离散编码随待压缩图像的局部信息内容的变化而变化,与待压缩图像的配合度更高,具有更好的压缩效果。本发明所述的图像压缩系统适用于对图像进行压缩和解压。
-
公开(公告)号:CN114569087A
公开(公告)日:2022-06-03
申请号:CN202210068364.8
申请日:2022-01-20
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明公开了一种基于多模态视觉的脉搏波采集系统及方法,所述系统包括:脉搏波采集设备以及感知薄膜,所述感知薄膜包括:脉象感知薄膜与脉象校准薄膜,所述脉象感知薄膜用于提取脉搏波的波动信息,所述脉象校准薄膜用于提取扰动信息;所述脉搏波采集设备包括:双目相机与腕部支撑枕,所述双目相机朝向所述感知薄膜设置,所述双目相机用于采集所述脉象感知薄膜与脉象校准薄膜的视频图像,以得到多模态视频流,所述双目相机包括可见光相机与红外相机;所述腕部支撑枕位于所述双目相机的下方,用于支撑腕部。本发明相对于现有脉搏波采集方法,因通过使用脉象校准薄膜剔除了肢体动作的扰动,提高了脉搏波的采集精度,且采集效率更高。
-
公开(公告)号:CN107481295B
公开(公告)日:2020-06-30
申请号:CN201710691448.6
申请日:2017-08-14
Applicant: 哈尔滨工业大学
IPC: G06T9/00
Abstract: 基于动态字节长度分配的卷积神经网络的图像压缩系统,属于图像压缩技术领域。所述图像压缩系统:字节长度分配图网络将卷积码编码器的中间特征,即字节长度特征,作为其输入,建立基于待压缩图像内容的字节长度分配图,并根据该字节长度分配图建立字节长度分配图模板。二值器将卷积码编码器输出的初步编码特征图转换为编码二值特征图,即离散编码。在进入卷积熵编码器之前,所述离散编码先与字节长度分配图模板进行点乘裁剪。因此,对于本发明所述的图像压缩系统,其待熵编码的离散编码随待压缩图像的局部信息内容的变化而变化,与待压缩图像的配合度更高,具有更好的压缩效果。本发明所述的图像压缩系统适用于对图像进行压缩和解压。
-
-
-
-
-
-
-
-