一种视频动作捕捉动画数据的优化方法及系统

    公开(公告)号:CN113538634B

    公开(公告)日:2024-06-21

    申请号:CN202110698546.9

    申请日:2021-06-23

    Applicant: 厦门大学

    Inventor: 姚俊峰 陈元庆

    Abstract: 本发明提供了动画制作技术领域的一种视频动作捕捉动画数据的优化方法及系统,方法包括如下步骤:步骤S10、在视频中选择需要优化的动画数据曲线,设定各所述动画数据曲线的曲线属性;步骤S20、设定各所述动画数据曲线的优化参数;步骤S30、利用最小二乘法以及三次贝塞尔曲线公式基于所述优化参数对各动画数据曲线进行优化,生成新动画曲线。本发明的优点在于:极大的提升了动画制作的效率以及质量。

    一种轻量级头部姿态估计方法及系统

    公开(公告)号:CN117877065A

    公开(公告)日:2024-04-12

    申请号:CN202311718339.0

    申请日:2023-12-14

    Applicant: 厦门大学

    Inventor: 姚俊峰 蔡堪佳

    Abstract: 本发明提供了头部姿态识别技术领域的一种轻量级头部姿态估计方法及系统,方法包括如下步骤:步骤S1、基于特征提取模块、通道注意力模块以及角度回归模块创建一头部姿态估计模型;步骤S2、获取大量的头部图像,基于各所述头部图像构建数据集,对数据集中的各头部图像进行预处理和标注;步骤S3、将数据集划分为训练集、验证集以及测试集;步骤S4、通过训练集对头部姿态估计模型进行训练,通过验证集对训练后的头部姿态估计模型进行验证;步骤S5、通过测试集对验证后的头部姿态估计模型进行测试,并不断优化头部姿态估计模型的损失函数;步骤S6、利用测试后的头部姿态估计模型进行头部姿态估计。本发明的优点在于:极大的提升了头部姿态估计速度。

    基于检索增强模型的对话查询生成模型的训练方法及装置

    公开(公告)号:CN117764140A

    公开(公告)日:2024-03-26

    申请号:CN202311537070.6

    申请日:2023-11-17

    Applicant: 厦门大学

    Abstract: 本申请公开了一种基于检索增强模型的对话查询生成模型的训练方法及装置,该方法包括获取候选查询集,并将其中每个候选查询依次输入到搜索引擎,以便得到每个候选查询对应的知识文档;构建检索增强对话回复生成模型,并根据对话上下文和每个候选查询对应的知识文档对构建检索增强对话回复生成模型进行训练;采用训练好的检索增强对话回复生成模型中的检索器对每个候选查询对应的知识文档进行打分,以得到每个候选查询对应的分数值;构建对话查询生成模型,并根据对话上下文、每个候选查询和每个候选查询对应的分数值对对话查询生成模型进行训练,以得到训练好的对话查询生成模型;从而能够考虑深度语义信息,降低噪声影响,以便提高模型性能。

    一种基于PCB模型的微表情识别方法及系统

    公开(公告)号:CN116884057A

    公开(公告)日:2023-10-13

    申请号:CN202310681810.7

    申请日:2023-06-09

    Applicant: 厦门大学

    Abstract: 本发明提供了表情识别技术领域的一种基于PCB模型的微表情识别方法及系统,方法包括如下步骤:步骤S10、获取人像视频,对所述人像视频中的各帧人头图像的人脸进行关键点检测;步骤S20、基于各所述关键点对各帧人头图像进行对齐、剪裁以及缩放的预处理,得到若干张人脸图像;步骤S30、对所述人脸图像的帧数进行归一化;步骤S40、对各所述人脸图像进行光流计算,得到光流图像序列;步骤S50、将所述光流图像序列输入PCB模型以进行微表情识别。本发明的优点在于:极大的提升了微表情识别性能。

    一种水墨图像渲染方法
    135.
    发明授权

    公开(公告)号:CN113538647B

    公开(公告)日:2023-09-15

    申请号:CN202110698531.2

    申请日:2021-06-23

    Applicant: 厦门大学

    Inventor: 姚俊峰 王兴铃

    Abstract: 本发明提供了图像处理技术领域的一种水墨图像渲染方法,包括如下步骤:步骤S10、获取图像模型,并基于模型类别对所述图像模型进行分类;步骤S20、对分类后的所述图像模型进行水墨风格化,输出风格化图像;步骤S30、对所述风格化图像进行渲染,得到水墨图像。本发明的优点在于:实现对图像模型进行风格化渲染,极大的提升了水墨图像渲染的适用范围。

    一种基于多流架构的微表情识别方法及系统

    公开(公告)号:CN116645718A

    公开(公告)日:2023-08-25

    申请号:CN202310681829.1

    申请日:2023-06-09

    Applicant: 厦门大学

    Abstract: 本发明提供了表情识别技术领域的一种基于多流架构的微表情识别方法及系统,方法包括:步骤S10、获取人像视频,对人像视频中的各帧人头图像的人脸进行关键点检测;步骤S20、基于各关键点对各帧人头图像进行对齐、剪裁以及缩放的预处理,得到若干张人脸图像;步骤S30、对各人脸图像进行光流计算,得到光流图像序列;步骤S40、基于光流图像序列计算光流Strain;步骤S50、利用三维快速傅里叶变换检测各人脸图像中的顶点帧;步骤S60、使用多流框架对顶点帧进行微表情特征提取,进而对微表情进行识别。本发明的优点在于:极大的提升了微表情特征的判别能力,进而极大的提升了微表情识别效果。

    一种基于GPU的各向异性视频过分割方法

    公开(公告)号:CN113012165B

    公开(公告)日:2023-06-23

    申请号:CN202110295652.2

    申请日:2021-03-19

    Applicant: 厦门大学

    Abstract: 一种基于GPU的各向异性视频过分割方法,涉及视频处理技术领域。1)加载视频到显存中,计算视频的光流场;2)给定种子点的初始位置,根据光流场计算种子点的各向异性矩阵,加载信息到显存中;3)根据泛洪并行框架,每个像素都以一系列的步长查询周围的种子点信息,并更新距离自己最近的种子点,所有像素点都记录最近种子点,得到视频分割结果;4)将种子点的位置更新到当前簇的中心,然后重新计算种子点在新位置的各向异性矩阵;5)重复步骤3)和4),直到分割结果趋于稳定或达到指定的迭代次数。利用视频的运动场更精确持久地捕捉物体的运动,各向异性超体素可以在GPU上并行实现,提高处理效率,视频分割准确率高,处理速度快。

    基于双注意力机制的十二导联心电信号的自动分类方法

    公开(公告)号:CN115568860A

    公开(公告)日:2023-01-06

    申请号:CN202211211126.4

    申请日:2022-09-30

    Applicant: 厦门大学

    Abstract: 本发明基于双注意力机制的十二导联心电信号的自动分类方法,获取十二导联心电图原始数据;对原始数据进行预处理;构建十二导联心电图的分类模型;使用训练完的分类模型即可进行12导联心电信号的自动分类。本发明采用并行计算的方式实现十二导联心电图的空间‑时间注意力机制的融合,对不同导联的心电信号、序列与序列之间的全局特征信息进行提取,通过CNN‑Transformer混合编码器实现双注意力机制并融合多尺度信息,可实现高精度的十二导联心电信号的分类,为临床决策提供辅助诊断依据,减轻医生工作负担。

    一种应用于机器人的分布式节点互联方法

    公开(公告)号:CN114124957B

    公开(公告)日:2022-12-06

    申请号:CN202111391958.4

    申请日:2021-11-19

    Applicant: 厦门大学

    Abstract: 本发明提供了计算机技术领域的一种应用于机器人的分布式节点互联方法,包括:步骤S10、客户端获取代码并转换为若干个结构化的节点;步骤S20、客户端将各节点发送给服务端;步骤S30、服务端将各节点拆解为一个消费者和若干个生产者,并将消费者加入消费者池,将生产者加入生产者池;步骤S40、服务端的发现器进行节点扫描,获取扫描到的节点携带的生产者并缓存在资源池中,并将生产者池中的生产者注入发现器;步骤S50、服务端的调度器基于消费者池中的消费者,从资源池中匹配对应的生产者并发送给客户端;步骤S60、客户端将接收的生产者关联的节点转换为对象,基于对象与对应的节点进行互联。本发明的优点在于:极大的提升了节点互联的自律性、灵活性以及兼容性。

    一种架子鼓乐谱识别方法及装置

    公开(公告)号:CN115146649A

    公开(公告)日:2022-10-04

    申请号:CN202210730185.6

    申请日:2022-06-24

    Applicant: 厦门大学

    Abstract: 本发明公开了一种架子鼓乐谱识别方法及装置,涉及乐谱识别技术领域。本发明创造性地通过将架子鼓乐谱图片转化并生成其对应的文本序列,再通过语义字典将语义项转化为数字序列,从而使得可以通过卷积循环神经网络进行架子鼓乐谱图片的识别训练,省略了中间的识别谱线、识别单个乐符等步骤,减轻了费力的组装设计,且更容易对各种属性或者高级特征进行特征的捕获与提取;单个模型相比于每个组件错误累加来说更加健壮,能有效减少错误的积累,在识别效果上具有优势。

Patent Agency Ranking