-
公开(公告)号:CN118334183B
公开(公告)日:2025-02-18
申请号:CN202410483271.0
申请日:2024-04-22
Applicant: 北京林业大学
IPC: G06T13/20 , G10L15/26 , G10L15/18 , G06N3/0455
Abstract: 本发明属于人工智能和机器学习领域,具体涉及了一种基于语音输入生成三维动作的方法、系统及设备,旨在解决现有技术基于语音指令转化成3D动作的方法效果不好的问题。本发明包括:将音频数据转化为文本形式,并进行文本解析和指令验证得到文本数据;对文本数据进行标记化处理、词嵌入处理以及添加位置编码形成维度位置向量并输入到Transformer模型中,生成动作描述序列;通过连贯性分数函数评估动作序列在上下文中的连贯性并设置连贯性阈值筛选动作序列得到高质量动作系列;基于模型对高质量动作系列进行降噪处理、姿态捕捉和时间捕捉最终得到3D运动序列。本发明能确保对各种复杂指令的高准确率解析和动作生成。
-
公开(公告)号:CN112581511B
公开(公告)日:2023-07-18
申请号:CN202011471438.X
申请日:2020-12-14
Applicant: 北京林业大学
Abstract: 本发明属于三维数据采集与处理领域,具体涉及了一种基于近似直立扫描点云快速配准的三维重建方法及系统,旨在解决现有技术未考虑实际点云采集中的点云近似直立性,点云配准效率低,从而导致三维重建效率、准确率和精度低的问题。本发明包括:获取近似直立扫描的目标点云和原始点云;通过自适应网格大小进行点云体素化;采用先验可靠区域引导点云初始配准;kd树结合ICP算法进行点云精确配准;结合初始配准和精确配准进行点云最终配准;基于配准后的点云进行三维重建。本发明充分考虑点云的近似直立性,快速精确实现点云配准,三维重建效率高、准确率和精度高。
-
公开(公告)号:CN110334761A
公开(公告)日:2019-10-15
申请号:CN201910595901.2
申请日:2019-07-03
Applicant: 北京林业大学
IPC: G06K9/62
Abstract: 本发明属于图像识别领域,具体涉及一种基于正交性约束增量非负矩阵分解的有监督图像识别方法,旨在为了解决现有有监督图像在线识别方法在新增样本较多时,累计训练时间消耗较长,识别效率较低的问题。本发明包括:获取初始样本集的矩阵表示Vc;获取Vc经ONMF算法分解得到基矩阵Wc和系数矩阵Hc;获取新增样本集的矩阵表示Vp,构建所有样本构成的数据矩阵Vz=[Vc,Vp],并基于Wc、Hc采用增加正交性约束的INMF算法获取基矩阵Wz;利用基矩阵Wz的Moore-Penrose逆作为投影变换矩阵,分别对Vz及待识别图像集的矩阵Vtest进行投影变换,然后训练分类器并对Vtest进行识别分类。本发明在新增训练样本较多时,可以快速地动态更新基矩阵,大幅减少了时间消耗。
-
公开(公告)号:CN109658371A
公开(公告)日:2019-04-19
申请号:CN201811477667.5
申请日:2018-12-05
Applicant: 北京林业大学
IPC: G06T5/50
Abstract: 本发明涉及图像融合技术领域,具体涉及一种红外图像与可见光图像的融合方法、系统及相关设备,目的在于克服现有技术方法在图像融合时易出现的模态混叠现象,以及融合结果中高频细节信息丢失、图像对比度降低的问题。本发明的融合方法包括:基于W-BEMD分解算法分别将两种源图像均分解成一系列高频细节子图像和一个低频轮廓子图像;基于局部区域方差选择与加权的融合规则,将两种源图像分解得到的高频细节子图像进行融合;基于区域能量选择与加权的融合规则,将两种源图像分解得到的低频轮廓子图像进行融合;将融合后的高频细节子图像与融合后的低频轮廓子图像进行W-BEMD逆变换,得到融合图像。本发明算法冗余度低,而且运算速度快。
-
公开(公告)号:CN109671155B
公开(公告)日:2023-06-23
申请号:CN201811570403.4
申请日:2018-12-21
Applicant: 北京林业大学
Abstract: 本发明涉及三维表面重建技术领域,具体涉及一种基于点云数据的表面网格重建方法、系统及设备,目的在于提高重建精度。本发明的重建方法包括:将点云数据的坐标信息投影到z轴,计算z坐标概率密度函数,进而计算出z坐标概率密度函数的曲率局部极值点;对每个局部极值点,经过该点并垂直于z轴画出一个平面作为一个横截面;根据预设的分割层数在局部极值点之间进行分割,得到多个垂直于z轴的横截面;将每个横截面上、下特定距离范围内的点均投影到该横截面上,进而计算该横截面的边界点;根据计算出的边界点拟合对应横截面的边界曲线,并进行重采样;连接所有相邻横截面上的重采样边界点,得到重建后的表面网格。本发明提高了点云数据表面重建的精度。
-
公开(公告)号:CN112581511A
公开(公告)日:2021-03-30
申请号:CN202011471438.X
申请日:2020-12-14
Applicant: 北京林业大学
Abstract: 本发明属于三维数据采集与处理领域,具体涉及了一种基于近似直立扫描点云快速配准的三维重建方法及系统,旨在解决现有技术未考虑实际点云采集中的点云近似直立性,点云配准效率低,从而导致三维重建效率、准确率和精度低的问题。本发明包括:获取近似直立扫描的目标点云和原始点云;通过自适应网格大小进行点云体素化;采用先验可靠区域引导点云初始配准;kd树结合ICP算法进行点云精确配准;结合初始配准和精确配准进行点云最终配准;基于配准后的点云进行三维重建。本发明充分考虑点云的近似直立性,快速精确实现点云配准,三维重建效率高、准确率和精度高。
-
公开(公告)号:CN110334761B
公开(公告)日:2021-05-04
申请号:CN201910595901.2
申请日:2019-07-03
Applicant: 北京林业大学
IPC: G06K9/62
Abstract: 本发明属于图像识别领域,具体涉及一种基于正交性约束增量非负矩阵分解的有监督图像识别方法,旨在为了解决现有有监督图像在线识别方法在新增样本较多时,累计训练时间消耗较长,识别效率较低的问题。本发明包括:获取初始样本集的矩阵表示Vc;获取Vc经ONMF算法分解得到基矩阵Wc和系数矩阵Hc;获取新增样本集的矩阵表示Vp,构建所有样本构成的数据矩阵Vz=[Vc,Vp],并基于Wc、Hc采用增加正交性约束的INMF算法获取基矩阵Wz;利用基矩阵Wz的Moore‑Penrose逆作为投影变换矩阵,分别对Vz及待识别图像集的矩阵Vtest进行投影变换,然后训练分类器并对Vtest进行识别分类。本发明在新增训练样本较多时,可以快速地动态更新基矩阵,大幅减少了时间消耗。
-
公开(公告)号:CN109697731B
公开(公告)日:2020-10-27
申请号:CN201811571128.8
申请日:2018-12-21
Applicant: 北京林业大学
Abstract: 本发明涉及体积计算技术领域,具体涉及一种基于点云数据的植物冠层体积计算方法、系统及相关设备,目的在于解决现有技术对植物冠层体积计算不理想的问题。本发明的计算方法包括:以植物冠层点云数据的三维坐标数据为初始值,将植物冠层点云数据的坐标信息投影到z轴,计算z坐标概率密度函数;根据z坐标概率密度函数,计算出z坐标概率密度函数的曲率局部极值点;对每个局部极值点,经过该点并垂直于z轴画出一个平面作为一个横截面;根据预设的分割层数,在局部极值点之间进行分割,得到多个垂直于z轴的横截面;根据横截面将植物冠层从上至下划分为一个椎体与多个台体,进而计算植物冠层的体积。本发明提高了植物冠层体积计算的准确度。
-
公开(公告)号:CN109697731A
公开(公告)日:2019-04-30
申请号:CN201811571128.8
申请日:2018-12-21
Applicant: 北京林业大学
Abstract: 本发明涉及体积计算技术领域,具体涉及一种基于点云数据的植物冠层体积计算方法、系统及相关设备,目的在于解决现有技术对植物冠层体积计算不理想的问题。本发明的计算方法包括:以植物冠层点云数据的三维坐标数据为初始值,将植物冠层点云数据的坐标信息投影到z轴,计算z坐标概率密度函数;根据z坐标概率密度函数,计算出z坐标概率密度函数的曲率局部极值点;对每个局部极值点,经过该点并垂直于z轴画出一个平面作为一个横截面;根据预设的分割层数,在局部极值点之间进行分割,得到多个垂直于z轴的横截面;根据横截面将植物冠层从上至下划分为一个椎体与多个台体,进而计算植物冠层的体积。本发明提高了植物冠层体积计算的准确度。
-
公开(公告)号:CN118471250B
公开(公告)日:2025-02-07
申请号:CN202410798138.4
申请日:2024-06-20
Applicant: 北京林业大学
Abstract: 本发明属于语音处理技术领域,涉及一种输入语音自动生成口型和表情的方法,包括:将输入的语音进行特征提取,得到音频特征序列;构建音生视频模型,包括:将不同语言和地区的人脸讲话视频,输入采用神经动态时间规整、基于注意力的时间对齐和音视频时间位置编码同步的Diffusion Transformer模型,训练得到音生视频模型;将音频特征序列输入音生视频模型,得到口型表情同步视频。本发明能够根据输入的语音,生成对应的口型表情同步视频,能够提升用户体验,进一步提高了生成视频的同步精度,提高了模型实时处理能力,生成的口型表情同步视频更加自然,能够跨语言和文化背景工作,适应全球不同地区的内容需求。
-
-
-
-
-
-
-
-
-