-
公开(公告)号:CN117746436A
公开(公告)日:2024-03-22
申请号:CN202311789029.8
申请日:2023-12-22
Applicant: 上海华讯网络系统有限公司
IPC: G06V30/148 , G06V10/82 , G06N3/0464
Abstract: 本发明提供了一种基于交叉熵正则化损失的设备铭牌中文字符识别方法及系统,包括:采集不同水利设备铭牌在不同光照角度、亮度下的中文字符图片,对采集到的中文字符图片进行标注,并将中文字符图片进行缩放处理;基于缩放后的中文字符图片构建SE‑ResNet‑50网络;中文字符图片输入SE‑ResNet‑50网络获取某个中文字符的概率,利用获取的某个中文字符的概率构造交叉熵损失函数,并在交叉熵损失函数中添加最大熵正则项,得到完整的损失函数,并将完整的损失函数中正则项的超参数添加到SE‑ResNet‑50网络;基于SE‑ResNet‑50网络构造中文字符识别模型,并对中文字符识别模型进行训练;对未知的字符图片进行缩放处理,利用训练后的中文字符识别模型进行汉字识别得到该字符图片所属的汉字。
-
公开(公告)号:CN119417958A
公开(公告)日:2025-02-11
申请号:CN202411664583.8
申请日:2024-11-20
Applicant: 上海华讯网络系统有限公司
Abstract: 本发明提供了一种基于单目相机的通用3D数字人实时动作捕捉方法及系统,包括:步骤S1:基于单目相机检测3D关键点,并将关键点对齐到统一坐标系下,从视频中检测面部3D地标点,并输出blendshape用于驱动数字人面部;步骤S2:将关键点转换通用驱动数据,将全身骨骼3D关键点坐标转换为对应骨骼的BVH旋转;步骤S3:令低延时平滑数据驱动3D数字人,将面部blendshape参数以及骨骼BVH旋转传输至渲染平台;转换骨骼旋转坐标系到渲染平台的坐标系,驱动3D数字人动作;使用blendshape参数对应控制数字人Morph Target,驱动数字人面部表情。本发明通过对躯干、手部以及面部的ROI区域进行单独检测,提高关键点的检测精度;并且控制数据是一个整体,提高数字人控制的完整度。
-
公开(公告)号:CN117727041A
公开(公告)日:2024-03-19
申请号:CN202311789038.7
申请日:2023-12-22
Applicant: 上海华讯网络系统有限公司
IPC: G06V30/148
Abstract: 本发明提供了一种基于水平投影和连通域的边端设备铭牌字符分割方法及系统,包括:步骤S1:对采集到的图像进行预处理;步骤S2:对预处理后的图像进行颜色反转;步骤S3:对颜色反转后的图像进行水平投影;步骤S4:采用连通域分割法进行单枚字符分割。本发明采用水平投影和连通域结合的字符分割方法不仅能够更精准的分割断裂和粘连的字符,并且实施速度也比仅采用连通域分割的方法更快。
-
-