基于单目相机的通用3D数字人实时动作捕捉方法及系统

    公开(公告)号:CN119417958A

    公开(公告)日:2025-02-11

    申请号:CN202411664583.8

    申请日:2024-11-20

    Abstract: 本发明提供了一种基于单目相机的通用3D数字人实时动作捕捉方法及系统,包括:步骤S1:基于单目相机检测3D关键点,并将关键点对齐到统一坐标系下,从视频中检测面部3D地标点,并输出blendshape用于驱动数字人面部;步骤S2:将关键点转换通用驱动数据,将全身骨骼3D关键点坐标转换为对应骨骼的BVH旋转;步骤S3:令低延时平滑数据驱动3D数字人,将面部blendshape参数以及骨骼BVH旋转传输至渲染平台;转换骨骼旋转坐标系到渲染平台的坐标系,驱动3D数字人动作;使用blendshape参数对应控制数字人Morph Target,驱动数字人面部表情。本发明通过对躯干、手部以及面部的ROI区域进行单独检测,提高关键点的检测精度;并且控制数据是一个整体,提高数字人控制的完整度。

    基于OCR的表格文字识别方法及系统

    公开(公告)号:CN118747902A

    公开(公告)日:2024-10-08

    申请号:CN202410893313.8

    申请日:2024-07-04

    Abstract: 本发明提供了一种基于OCR的表格文字识别方法和系统,包括:解析PDF文件,将PDF文件转换为图像数据;对图像数据进行版面分析,得到版面分析结果;判断是否存在表格元素;是,则保存坐标信息;否,则按照纯文本进行识别;基于深度学习网络,得出表格检测框数量与区域;寻找图像中的轮廓;得出表格检测框数量与区域;判断经前者得出的检测框数量与后者得出的检测框数量是否相等,是,则采用后者得出的检测框数量作为输入项;否,则采用检测框数量更多的结果作为输入项;返回每行的文本内容,得出结果数据。本发明进行页面的表格检测,检测出页面中存在的表格区域,为单元格检测和信息提取做准备;利用此方法可以提高表格检测的精度。

    安全帽佩戴检测识别方法和系统
    4.
    发明公开

    公开(公告)号:CN117197742A

    公开(公告)日:2023-12-08

    申请号:CN202311175962.6

    申请日:2023-09-12

    Abstract: 本发明提供了一种安全帽佩戴检测识别方法和系统,将原始输入图片输入已训练模型,利用网络架构W‑PicoDet对有无佩戴安全帽进行检测识别,得到安全帽的检测结果;其中,网络架构W‑PicoDet采用RepVGG结构作为主干特征网络中的卷积结构,让单个的卷积具有残差边;采用步长为2的ESBlock,增加通道分组和通道混淆操作,使得不同通道的特征相融合;对检测结果坐标进行解码和尺度变换,再映射到原始输入图片上。本发明在不改变模型参数量的情况下进一步提高了安全帽的识别精度,其中增加了模型对小目标的识别效果,利用sSE结构对输入特征图进行特征注意力重组,更趋向于对应类别的关注,提高了模型的分类精度。

    基于语义分割和AI微服务器的水位高度检测系统及方法

    公开(公告)号:CN118038337A

    公开(公告)日:2024-05-14

    申请号:CN202410366515.7

    申请日:2024-03-28

    Abstract: 本发明提供了一种根据本发明提供的一种基于语义分割和AI微服务器的水位高度检测方法及系统,包括:数据采集步骤:通过前端相机采集对应的水位视频流数据;模型加载步骤:加载模型,并对所述模型进行预训练及优化处理;业务处理步骤:对所述水位视频流数据进行图像标准化处理,以及根据预处理及优化后的模型进行前后处理及算法推理得到对应的类别的mask掩码矩阵,进而得到所检测的水位高度数据。本发明采用语义分割神经网络代替传统的深度学习识别水位,相比于传统深度学习模型精度更高,结果准确性更高。

    新型山洪前端仪器仪表读数自动识别方法及系统

    公开(公告)号:CN117727046A

    公开(公告)日:2024-03-19

    申请号:CN202311791640.4

    申请日:2023-12-22

    Abstract: 本发明提供了一种新型山洪前端仪器仪表读数自动识别方法及系统,包括:构造A‑U2‑Net卷积神经网络模型主干网络;将提取的特征和ECA模块输出特征相加后再输入下一个特征提取层进行特征提取;将编码阶段输出的语义特征进行融合;构建上采样核预测模块及内容感知模块;对指针式仪表数据集进行预处理,对指针式仪表进行VOC格式数据集的标注,将数据集输入到YOLOV7模型中进行训练;将仪表图像及生成数据输入到改进的A‑U2‑Net模型中进行训练;输入图片通过组合算法检测出结果后,对结果进行解码并写入到分离的图片上。本发明消除了RSU模块提取多尺度特征时残留在特征通道内的无效特征干扰,进一步增强模型的鲁棒性。

    基于水平投影和连通域的边端设备铭牌字符分割方法及系统

    公开(公告)号:CN117727041A

    公开(公告)日:2024-03-19

    申请号:CN202311789038.7

    申请日:2023-12-22

    Abstract: 本发明提供了一种基于水平投影和连通域的边端设备铭牌字符分割方法及系统,包括:步骤S1:对采集到的图像进行预处理;步骤S2:对预处理后的图像进行颜色反转;步骤S3:对颜色反转后的图像进行水平投影;步骤S4:采用连通域分割法进行单枚字符分割。本发明采用水平投影和连通域结合的字符分割方法不仅能够更精准的分割断裂和粘连的字符,并且实施速度也比仅采用连通域分割的方法更快。

Patent Agency Ranking