基于三维场景的在线视频直播系统

    公开(公告)号:CN113382305A

    公开(公告)日:2021-09-10

    申请号:CN202110581378.5

    申请日:2021-05-27

    Abstract: 基于三维场景的在线视频直播系统属于视频直播领域,采用控制变量法在保证低延时、单线路的基础上实现了支持多个外接摄像头视频内容传输的多内容低延时单路视频直播系统。多个外接输入设备所捕获的视频数据在网络传输的过程中不会因为外接视频线路的增多出现网络延迟,用户可以无限制的增加外接摄像头捕获的视频内容而保证延时始终不变。技术上将多个外接摄像头所捕获的视频数据在Unity 3D引擎中搭建的虚拟三维场景下呈现在画布上并使用虚拟摄像机进行录制与融合,再通过单路直播的形式将录制的数据进行推流,使服务端推流过程中由任意数量个外接摄像头所捕获的视频数据在网络延时不变的情况下都能够被客户端稳定接收。

    一种基于多方向字典的深度图像超分辨率方法

    公开(公告)号:CN107767357B

    公开(公告)日:2021-04-09

    申请号:CN201710825666.4

    申请日:2017-09-14

    Abstract: 本发明公开一种基于多方向字典的深度图像超分辨率方法,包括以下步骤:步骤一:提取彩色图像特征,获得轮廓图;步骤二:对低分辨率深度图像进行插值,用高通滤波来表示其特征;步骤三:将低分辨率深度图像进行分块,计算每个图像块的几何方向;步骤四:进行字典训练;步骤五:根据步骤三中得到的几何方向,选择字典,重建深度图像。采用本发明的技术方案,使深度图像的分辨率得到增强,边界纹理区域清晰。

    一种黑色素癌图像的分割方法及网络

    公开(公告)号:CN112686837A

    公开(公告)日:2021-04-20

    申请号:CN202011361151.1

    申请日:2020-11-27

    Inventor: 王志强 范蕊

    Abstract: 一种黑色素癌图像的分割方法及网络,方法包括:(1)对皮肤镜检查图像进行图像预处理;(2)构建用于黑色素癌图像分割的轻量级皮肤癌分割网络,该网络采用编码器‑解码器的结构,包括:(2.1)编码器利用深度可分离卷积和通道随机融合的手段在降低网络参数的同时,保证通道间的信息交流,提取更加有用的特征信息;(2.2)解码器采用注意力机制并结合新的特征融合方式,来保证低层阶段更相关的特征信息和高层阶段的特征信息进行融合,以提高分割的准确率;(2.3)通过全局平均池化层来计算得分获取分割结果。

    一种基于面部特征的脸谱的人脸投影方法

    公开(公告)号:CN105893984A

    公开(公告)日:2016-08-24

    申请号:CN201610285466.X

    申请日:2016-04-29

    CPC classification number: G06K9/00281 G06K9/00248 G06K9/00288 G06K9/6271

    Abstract: 本发明公开了一种基于面部特征的脸谱的人脸投影方法,建立脸谱纹样数据库;获取含有人脸的视频帧,进行灰度处理;获取灰度图像上各个位置的所有Haar特征,并求出其特征值;利用Adaboost算法对特征值进行训练,得到每个位置最优的特征点;将特征点加入到主动外观模型中,计算人脸的鼻尖坐标、人脸平面偏转角及侧面深度偏转角,建立人脸模型;选取所需脸谱纹样并选取脸谱纹样控制点,对脸谱纹样进行拟合,得到拟合曲线;对拟合曲线进行变形并组合得到脸谱模型;根据鼻尖坐标、人脸平面偏转角及侧面深度偏转角来调整投影角度;将脸谱模型投影到人脸模型上。本发明公开的方法灵活多变,简单快捷,实时准确的将脸谱投影到人脸上。

    一种黑色素癌图像的分割方法及网络

    公开(公告)号:CN112686837B

    公开(公告)日:2024-07-02

    申请号:CN202011361151.1

    申请日:2020-11-27

    Inventor: 王志强 范蕊

    Abstract: 一种黑色素癌图像的分割方法及网络,方法包括:(1)对皮肤镜检查图像进行图像预处理;(2)构建用于黑色素癌图像分割的轻量级皮肤癌分割网络,该网络采用编码器‑解码器的结构,包括:(2.1)编码器利用深度可分离卷积和通道随机融合的手段在降低网络参数的同时,保证通道间的信息交流,提取更加有用的特征信息;(2.2)解码器采用注意力机制并结合新的特征融合方式,来保证低层阶段更相关的特征信息和高层阶段的特征信息进行融合,以提高分割的准确率;(2.3)通过全局平均池化层来计算得分获取分割结果。

    一种基于视觉语义SLAM的垃圾捡拾机器人

    公开(公告)号:CN111360780A

    公开(公告)日:2020-07-03

    申请号:CN202010202769.7

    申请日:2020-03-20

    Abstract: 本发明公开了一种基于视觉语义SLAM的垃圾捡拾机器人,包括机器人本体和视觉语义SLAM系统。本体包括底盘、设于底盘上方的集成仓、底盘上的行走组件、垃圾回收机构、升降机构、机械臂、摄像机。本发明利用导航摄像机获取图像信息,惯性测量传感器能检测障碍物信息,图像信息和机器人运动时的加速度和角速度信息传给SLAM系统作出决策,控制垃圾捡拾机器人进行地图构建、定位、导航和动态避障。视觉语义SLAM系统通过构建语义地图能够识别垃圾并对垃圾进行分类,机械臂控制系统控制机械臂捡拾垃圾并放入对应的垃圾回收装置中。另外还解决了语义地图构建过程中物体边界不够精确及场景中出现运动物体时系统精确性与鲁棒性降低的问题。

    一种基于面部特征的脸谱的人脸投影方法

    公开(公告)号:CN105893984B

    公开(公告)日:2018-11-20

    申请号:CN201610285466.X

    申请日:2016-04-29

    Abstract: 本发明公开了一种基于面部特征的脸谱的人脸投影方法,建立脸谱纹样数据库;获取含有人脸的视频帧,进行灰度处理;获取灰度图像上各个位置的所有Haar特征,并求出其特征值;利用Adaboost算法对特征值进行训练,得到每个位置最优的特征点;将特征点加入到主动外观模型中,计算人脸的鼻尖坐标、人脸平面偏转角及侧面深度偏转角,建立人脸模型;选取所需脸谱纹样并选取脸谱纹样控制点,对脸谱纹样进行拟合,得到拟合曲线;对拟合曲线进行变形并组合得到脸谱模型;根据鼻尖坐标、人脸平面偏转角及侧面深度偏转角来调整投影角度;将脸谱模型投影到人脸模型上。本发明公开的方法灵活多变,简单快捷,实时准确的将脸谱投影到人脸上。

    基于三维场景的在线视频直播系统

    公开(公告)号:CN113382305B

    公开(公告)日:2023-05-23

    申请号:CN202110581378.5

    申请日:2021-05-27

    Abstract: 基于三维场景的在线视频直播系统属于视频直播领域,采用控制变量法在保证低延时、单线路的基础上实现了支持多个外接摄像头视频内容传输的多内容低延时单路视频直播系统。多个外接输入设备所捕获的视频数据在网络传输的过程中不会因为外接视频线路的增多出现网络延迟,用户可以无限制的增加外接摄像头捕获的视频内容而保证延时始终不变。技术上将多个外接摄像头所捕获的视频数据在Unity 3D引擎中搭建的虚拟三维场景下呈现在画布上并使用虚拟摄像机进行录制与融合,再通过单路直播的形式将录制的数据进行推流,使服务端推流过程中由任意数量个外接摄像头所捕获的视频数据在网络延时不变的情况下都能够被客户端稳定接收。

Patent Agency Ranking