基于点云数据的表面网格重建方法、系统及相关设备

    公开(公告)号:CN109671155A

    公开(公告)日:2019-04-23

    申请号:CN201811570403.4

    申请日:2018-12-21

    Abstract: 本发明涉及三维表面重建技术领域,具体涉及一种基于点云数据的表面网格重建方法、系统及相关设备,目的在于提高重建精度。本发明的重建方法包括:将点云数据的坐标信息投影到z轴,计算z坐标概率密度函数,进而计算出z坐标概率密度函数的曲率局部极值点;对每个局部极值点,经过该点并垂直于z轴画出一个平面作为一个横截面;根据预设的分割层数在局部极值点之间进行分割,得到多个垂直于z轴的横截面;将每个横截面上、下特定距离范围内的点均投影到该横截面上,进而计算该横截面的边界点;根据计算出的边界点拟合对应横截面的边界曲线,并进行重采样;连接所有相邻横截面上的重采样边界点,得到重建后的表面网格。本发明提高了点云数据表面重建的精度。

    一种输入语音自动生成口型和表情的方法

    公开(公告)号:CN118471250A

    公开(公告)日:2024-08-09

    申请号:CN202410798138.4

    申请日:2024-06-20

    Abstract: 本发明属于语音处理技术领域,涉及一种输入语音自动生成口型和表情的方法,包括:将输入的语音进行特征提取,得到音频特征序列;构建音生视频模型,包括:将不同语言和地区的人脸讲话视频,输入采用神经动态时间规整、基于注意力的时间对齐和音视频时间位置编码同步的Diffusion Transformer模型,训练得到音生视频模型;将音频特征序列输入音生视频模型,得到口型表情同步视频。本发明能够根据输入的语音,生成对应的口型表情同步视频,能够提升用户体验,进一步提高了生成视频的同步精度,提高了模型实时处理能力,生成的口型表情同步视频更加自然,能够跨语言和文化背景工作,适应全球不同地区的内容需求。

    基于语音输入生成三维动作的方法、系统及设备

    公开(公告)号:CN118334183A

    公开(公告)日:2024-07-12

    申请号:CN202410483271.0

    申请日:2024-04-22

    Abstract: 本发明属于人工智能和机器学习领域,具体涉及了一种基于语音输入生成三维动作的方法、系统及设备,旨在解决现有技术基于语音指令转化成3D动作的方法效果不好的问题。本发明包括:将音频数据转化为文本形式,并进行文本解析和指令验证得到文本数据;对文本数据进行标记化处理、词嵌入处理以及添加位置编码形成维度位置向量并输入到Transformer模型中,生成动作描述序列;通过连贯性分数函数评估动作序列在上下文中的连贯性并设置连贯性阈值筛选动作序列得到高质量动作系列;基于模型对高质量动作系列进行降噪处理、姿态捕捉和时间捕捉最终得到3D运动序列。本发明能确保对各种复杂指令的高准确率解析和动作生成。

    红外图像与可见光图像的融合方法、系统及相关设备

    公开(公告)号:CN109658371B

    公开(公告)日:2020-12-15

    申请号:CN201811477667.5

    申请日:2018-12-05

    Abstract: 本发明涉及图像融合技术领域,具体涉及一种红外图像与可见光图像的融合方法、系统及相关设备,目的在于克服现有技术方法在图像融合时易出现的模态混叠现象,以及融合结果中高频细节信息丢失、图像对比度降低的问题。本发明的融合方法包括:基于W‑BEMD分解算法分别将两种源图像均分解成一系列高频细节子图像和一个低频轮廓子图像;基于局部区域方差选择与加权的融合规则,将两种源图像分解得到的高频细节子图像进行融合;基于区域能量选择与加权的融合规则,将两种源图像分解得到的低频轮廓子图像进行融合;将融合后的高频细节子图像与融合后的低频轮廓子图像进行W‑BEMD逆变换,得到融合图像。本发明算法冗余度低,而且运算速度快。

Patent Agency Ranking