一种基于智能手机的光流计算方法及装置

    公开(公告)号:CN114689034A

    公开(公告)日:2022-07-01

    申请号:CN202210250754.7

    申请日:2022-03-15

    Inventor: 吴军 杜晓康 罗瀛

    Abstract: 本发明涉及图像处理技术领域,具体涉及一种基于智能手机的光流计算方法及装置,包括获取手机的传感器数据;对传感器数据进行姿态解算,得到外参数据;基于外参数据对图像进行置平,得到置平图像;基于置平图像进行光流计算,得到速度信息;通过转接芯片将速度信号传输给飞行控制器,手机具备的高性能处理器,利用手机内部传感器得到的姿态数据并基于手机高性能处理器,对图像进行置平以使其尽可能符合图像光流计算假设条件,将有助于提高光流算法的计算精度和性能,解决了现有的光流计算方法精度较低,影响视觉导航装置的可靠性的问题。

    一种嵌入式多镜头全景视频成像方法及装置

    公开(公告)号:CN113225491A

    公开(公告)日:2021-08-06

    申请号:CN202110353681.X

    申请日:2021-04-01

    Abstract: 本发明公开了一种嵌入式多镜头全景视频成像方法及装置,包括ARM端、GPU端和多路摄像头,将任一所述摄像头作为圆心,其余多个所述摄像头采用水平环绕式均匀阵列于处于圆心的所述摄像头四周;对ARM端进行初始化,并读取查找表和对缓存池内存进行划分;获取多路摄像头数据,并对所述摄像头数据进行缓存和格式转换;基于核函数的多个形参,利用双线性插值法对得到的多路输入影像进行运算和加速,生成对应的全景影像;根据全景影像帧率与分辨率对显示屏参数进行设置,并在设置完成后对所述全景影像进行输出,同时释放缓存,完成全景视频输出显示,能够实现多路视频的实时拼接。

    一种ARM-FPGA协同的广域视频实时融合方法及嵌入式设备

    公开(公告)号:CN111193877A

    公开(公告)日:2020-05-22

    申请号:CN202010067417.5

    申请日:2020-01-20

    Abstract: 本发明公开了一种ARM-FPGA协同的广域视频实时融合方法及嵌入式设备,ARM-FPGA协同的广域视频实时融合方法包括读取Linux操作系统的镜像文件,启动整个Linux嵌入式操作系统,并完成系统的Linux内核、文件系统以及设备树的初始化配置和视频流解码库的加载;获取第一数量路网络摄像机视频流,并基于视频流解码库进行解码,得到第一数量路视频的帧图像;基于存储至安全数码卡内的查找表文件对第一数量路视频的帧图像进行融合处理,得到全景图像,其中,查找表文件包括第一坐标映射表、第二坐标映射表和加权融合权重列表。实现运用查找表文件,用于缝合线拼接方式下不同场景、监控视角、位置视频影像间的融合,具有良好的通用性。

    一种应用于噪声环境下语音识别的语音增强方法

    公开(公告)号:CN108831495A

    公开(公告)日:2018-11-16

    申请号:CN201810564920.4

    申请日:2018-06-04

    Abstract: 本发明公开了一种应用于噪声环境下语音识别的语音增强方法,该方法将利用语音时频域稀疏性原理的基于时频掩蔽的改进MVDR波束形成与改进维纳滤波相结合,采集麦克风阵列语音信号,构建一个基于时频掩蔽的MVDR波束形成器,充分利用语音信号的空间信息,增强目标方向的语音信号,抑制其他方向噪声的干扰,然后通过一个改进的维纳滤波器去除残留的噪声并提高语音可懂度,该方法应用在语音识别前端,能够有效去除噪声,提高语音可懂度,进而提高语音识别系统的识别率,解决了在噪声环境下如何减少语音失真,提高噪声环境下语音的识别率的问题。该方法可应用在家居型机器人,智能语音设备等方面。

    一种面向大规模场景数据的点云滤波方法

    公开(公告)号:CN119478623A

    公开(公告)日:2025-02-18

    申请号:CN202411454064.9

    申请日:2024-10-17

    Inventor: 吴军 陈睿星 罗瀛

    Abstract: 本发明涉及三维图像计算处理技术领域,具体涉及一种面向大规模场景数据的点云滤波方法,以多层感知机MLP网络PointNet为基础,构建点云滤波网络SC‑CNN,利用坡度约束的最远点采样模块对原始点云进行自适应子区域划分、坡度预分类以及子区域样本采样,再结合Copula相关性与注意力机制的类内点特征增强模块,将点云中的地面点和非地面点分别作为变量,利用Copula模型对变量数据相关性的量化分析来增强网络从稀疏点云中学习分类特征的能力并最大程度减少分类误差,提高整体滤波精度;最后结合Copula相关性与置信度估计的分类误差纠正模块,将Copula验证的类内点与校准后的歧义点合并即可得到滤波结果。

    一种基于FPGA的遥感影像正射纠正并行系统

    公开(公告)号:CN111275608B

    公开(公告)日:2023-03-14

    申请号:CN202010066954.8

    申请日:2020-01-20

    Abstract: 本发明公开了一种基于FPGA的遥感影像正射纠正并行系统,所述数据加载模块将DEM数字高程模型分块及分块对应的原始影像同步发送至所述传输模块/存储芯片,所述转换模块将数据流转换成独立影像帧和分块的数字高程模型,所述写入模块将当前数字高程模型分块的宽度、高度及ID号发送至所述地面坐标生成模块,所述地面坐标生成模块生成地面空间坐标X、Y,所述高程插值模块获取数字高程值Z,所述3D‑2D坐标映射模块获取二维投影坐标,所述影像插值模块获取正射影像,设定输入原始遥感影像与输出正射影像的分辨率大小为1920*1080,FPGA处理器工作的时钟频率是150MHz,FPGA内部的片上存储资源BRAM为2MB时,平均在10ms时间内可完成一张影像正射纠正处理,具有极高的计算效率。

    一种应用于噪声环境下语音识别的语音增强方法

    公开(公告)号:CN108831495B

    公开(公告)日:2022-11-29

    申请号:CN201810564920.4

    申请日:2018-06-04

    Abstract: 本发明公开了一种应用于噪声环境下语音识别的语音增强方法,该方法将利用语音时频域稀疏性原理的基于时频掩蔽的改进MVDR波束形成与改进维纳滤波相结合,采集麦克风阵列语音信号,构建一个基于时频掩蔽的MVDR波束形成器,充分利用语音信号的空间信息,增强目标方向的语音信号,抑制其他方向噪声的干扰,然后通过一个改进的维纳滤波器去除残留的噪声并提高语音可懂度,该方法应用在语音识别前端,能够有效去除噪声,提高语音可懂度,进而提高语音识别系统的识别率,解决了在噪声环境下如何减少语音失真,提高噪声环境下语音的识别率的问题。该方法可应用在家居型机器人,智能语音设备等方面。

    一种全景视频直播系统构建方法
    8.
    发明公开

    公开(公告)号:CN114513675A

    公开(公告)日:2022-05-17

    申请号:CN202210001527.0

    申请日:2022-01-04

    Inventor: 吴军 易博 罗瀛

    Abstract: 本发明涉及视频直播技术领域,尤其涉及一种全景视频直播系统构建方法,通过局域网的搭建,将多路相机、NVR和视频处理设备连接起来,形成一个无线通信系统,使得视频处理设备可以从NVR中获取多路相机的实时或回放流,并将获取到的视频流进行解码得到多幅图像,经过视频拼接生成相应的全景图像,并将此全景图像置于一幅Mat封装的幕布上实现多路图像重新布局,最后基于H.265标准修改的FFmpeg编码工具,对获取到的全景图像进行硬件编码,设置视频相关参数,在视频编码后利用修改后的流媒体服务器对视频流进行推送,实现多路视频输入,单路视频输出,解决现有的全景直播系统构成复杂以及直播效果不佳的技术问题。

    一种基于FPGA的遥感影像正射纠正并行系统

    公开(公告)号:CN111275608A

    公开(公告)日:2020-06-12

    申请号:CN202010066954.8

    申请日:2020-01-20

    Abstract: 本发明公开了一种基于FPGA的遥感影像正射纠正并行系统,所述数据加载模块将DEM数字高程模型分块及分块对应的原始影像同步发送至所述传输模块/存储芯片,所述转换模块将数据流转换成独立影像帧和分块的数字高程模型,所述写入模块将当前数字高程模型分块的宽度、高度及ID号发送至所述地面坐标生成模块,所述地面坐标生成模块生成地面空间坐标X、Y,所述高程插值模块获取数字高程值Z,所述3D-2D坐标映射模块获取二维投影坐标,所述影像插值模块获取正射影像,设定输入原始遥感影像与输出正射影像的分辨率大小为1920*1080,FPGA处理器工作的时钟频率是150MHz,FPGA内部的片上存储资源BRAM为2MB时,平均在10ms时间内可完成一张影像正射纠正处理,具有极高的计算效率。

    一种基于机器视觉的夹片缺陷检测方法

    公开(公告)号:CN107490583A

    公开(公告)日:2017-12-19

    申请号:CN201710819281.7

    申请日:2017-09-12

    Abstract: 本发明公开了一种基于机器视觉的夹片缺陷检测方法,包括以下步骤:(1)夹片工件图像获取及预处理;(2)对工件图像进行模板匹配定位与位置矫正;(3)进行图像分割与形态学操作;(4)根据所测特征构建相关检测区域,分析各类缺陷样品的数据,得出各类缺陷的判别规则并进行缺陷检测以下缺陷:平牙、烂牙、重牙、光板、短料、锯偏、锯斜。本发明有效地解决了目前人工检测速度慢、效率低、成本高的问题,同时具有对初始化不敏感,具有鲁棒性强的优点,提高了夹片的生产自动化程度和产品质量。

Patent Agency Ranking