-
公开(公告)号:CN116704409A
公开(公告)日:2023-09-05
申请号:CN202310652716.9
申请日:2023-06-05
Applicant: 吉林大学
IPC: G06V20/40 , G10L25/51 , G06V10/764 , G06V10/774 , G06V40/10
Abstract: 一种基于音视频多模态的古筝弹奏指法评估方法属音乐人工智能交叉学科技术领域,本发明利用机器视听觉数据和古筝专业知识联合驱动,实现基于多模态的古筝弹奏基本指法评估。本发明融合古筝知识、图像识别、视频理解、音频分析,制定了基于视听觉的古筝弹奏基本指法评估量表;构建了古筝弹奏音视频数据集;提出了基于音视频的古筝弹奏指法评估算法,将待评估指法分为视频流和音频流,在视觉方面采用基于图像的手型识别方法和基于视频的指法评估方法,在听觉方面采用基于音频的音准比对方法,最终融合二者的评估结果。实际效果表明,本发明提出的基于音视频多模态的古筝弹奏指法评估方法,具有可行性和有效性,能实现对古筝弹奏基本指法的智能评估。
-
公开(公告)号:CN109934042A
公开(公告)日:2019-06-25
申请号:CN201711345054.1
申请日:2017-12-15
Applicant: 吉林大学
IPC: G06K9/00
Abstract: 基于卷积神经网络的自适应视频对象行为轨迹分析方法属图像工程和机器视觉技术领域,本发明针对现实场景中的监控视频,采用核相关滤波算法对视频对象进行有效地检测跟踪,从而生成有向曲线的轨迹图,再基于深度学习利用卷积神经网络,自适应地训练学习当前场景下的正常行为轨迹,最终对可疑行为进行判别;本发明将深度学习用于视频对象的行为分析中,能自适应地学习场景中的正常行为轨迹,无需人为定义,从而保障了可疑行为判定的可靠性,在现实场景中可不断扩展使用背景,检测跟踪部分利用循环矩阵特性,且深度学习的输入为二维轨迹图,既保留了视频的时空特征,又最大限度确保了实时性。
-
公开(公告)号:CN109063594A
公开(公告)日:2018-12-21
申请号:CN201810767515.2
申请日:2018-07-13
Applicant: 吉林大学
CPC classification number: G06K9/0063 , G06K9/4642 , G06K9/6256 , G06K9/6269 , G06K2209/21 , G06N3/0454 , G06N3/08
Abstract: 基于YOLOv2的遥感图像快速目标检测方法属图像处理和模式识别技术领域,本发明实现了对遥感图像中的重要目标的快速检测;首先构建了遥感图像数据集用于模型的训练及性能检测;然后提出了一种适用于遥感图像分类的卷积神经网络结构用于特征提取,进而构建目标检测网络。针对卷积神经网络对小目标检测能力差这一问题,本发明采用增加训练尺度、批量正则化等方法提升了网络的性能。本发明定义了偏移因子校正目标位置,利用SVM分类器对检测结果进行目标背景二次分类,在保证检测精度的同时保障了检测速度,实现了端到端检测。最重要的是,模型允许将新数据的检测结果扩充到训练数据集中,从而更新训练目标检测网络,不断提升模型的泛化能力。
-
公开(公告)号:CN104809455B
公开(公告)日:2017-12-19
申请号:CN201510256419.8
申请日:2015-05-19
Applicant: 吉林大学
IPC: G06K9/00
Abstract: 基于可判别性二叉树投票的动作识别方法属计算机视觉技术领域,本发明提出一种人动作行为分析和准确定位的方法,主要分为训练部分和检测部分,训练部分将连续动作分解成时空立方块,提取立方块低维特征,在二叉树构建过程中,通过最小化目标类别不确定性和立体块中心偏移不确定性分裂左右结点,使得叶结点中立体块集合纯度最高,当二叉树达到最大深度或者叶结点立体块数低于阈值时,二叉树构建完成;检测部分将检测立体块遍历二叉树集,叶结点为到达的立体块进行投票,在动作空间寻求最大值,确定动作类别和目标中心位置,实验结果证明,在低分辨率、图像特征明显的视频序列中,本发明能准确判断人物的动作类别和人物位置。
-
公开(公告)号:CN104853185A
公开(公告)日:2015-08-19
申请号:CN201510308249.3
申请日:2015-06-06
Applicant: 吉林大学
Abstract: 结合多视差和运动的立体视频舒适度评价方法属立体视频视觉舒适度评价技术领域,本发明提出了将物体的三种视差与物体的运动特性作为影响立体视频舒适度重要因素;提取帧内显著物体视差、帧内相关背景视差、帧间视差和运动变量这四个对立体视频舒适度有影响的因素,合成视差图并提取水平视差,计算深度视差;结合深度感知理论和最小二乘拟和方法建立主观评价与四大因素的函数关系,得到立体视频舒适度评价模型,再利用主观评价的方法对模型进行评定;本发明提出了一种新的对立体视频舒适度评价的方法,所建立的模型可以很好地模拟人眼的主观感受,对于研究人眼观看立体视频的舒适度有重要意义。
-
公开(公告)号:CN104809455A
公开(公告)日:2015-07-29
申请号:CN201510256419.8
申请日:2015-05-19
Applicant: 吉林大学
IPC: G06K9/00
CPC classification number: G06K9/00342 , G06K9/00348 , G06K9/00369
Abstract: 基于可判别性二叉树投票的动作识别方法属计算机视觉技术领域,本发明提出一种人动作行为分析和准确定位的方法,主要分为训练部分和检测部分,训练部分将连续动作分解成时空立方块,提取立方块低维特征,在二叉树构建过程中,通过最小化目标类别不确定性和立体块中心偏移不确定性分裂左右结点,使得叶结点中立体块集合纯度最高,当二叉树达到最大深度或者叶结点立体块数低于阈值时,二叉树构建完成;检测部分将检测立体块遍历二叉树集,叶结点为到达的立体块进行投票,在动作空间寻求最大值,确定动作类别和目标中心位置,实验结果证明,在低分辨率、图像特征明显的视频序列中,本发明能准确判断人物的动作类别和人物位置。
-
-
-
-
-