基于改进VLS的立体视频编码方法

    公开(公告)号:CN101841720B

    公开(公告)日:2011-08-10

    申请号:CN201010182545.0

    申请日:2010-05-25

    Applicant: 东南大学

    Inventor: 王翀 赵力 邹采荣

    Abstract: 本发明公布了一种基于改进载量提升方案(VLS)的立体视频编码方法,本发明通过并矢滤波器来获得左右视频图像的小波参数,采用提升方法重构左右视频图像,得到左右视频图像的详细系数和近似系数。本发明将改进的VLS结构用在输入立体视频序列上,将生成的参数进行编码。然而为了可以渐进的重构,编码方法要允许质量的可伸缩性。按照重要性的不同来按序编码参数。采用了国家音视频标准(AVS)编解码器rm52j_R1,因为它有着很好的压缩效率和质量可伸缩性。

    基于JND和AR模型的感知视频压缩方法

    公开(公告)号:CN101841723B

    公开(公告)日:2011-08-03

    申请号:CN201010182160.4

    申请日:2010-05-25

    Applicant: 东南大学

    Abstract: 本发明公布了一种基于可观测的衰减(Just Noticeable Distortion,JND)和自回归(Auto-regressive,AR)模型的感知视频压缩方法,包括了纹理区域的分割算法和基于自回归模型的合成算法。我们首先用基于JND的分割算法将视频中的纹理区域分割出来,接着用自回归模型合成纹理区域。本发明提出了空时JND模型,准确有效地进行了纹理区域的分割。设计了AR模型,通过简单计算,在保证视频质量的同时,大大提高了实时性。开发了结合人眼视觉特性的视频压缩技术,进一步提高了视频的压缩效率,减少了比特率。

    一种转子碰摩声发射源定位方法

    公开(公告)号:CN101477194B

    公开(公告)日:2011-07-06

    申请号:CN200910025081.X

    申请日:2009-02-17

    Applicant: 东南大学

    Abstract: 本发明公布了一种转子碰摩声发射源定位方法。本发明通过转子碰摩试验台获得声发射信号,建立基于能量衰减的声发射信号的传播模型,并且将定位问题转化为系统估计问题,利用自适应次梯度投影方法进行系统估计,从而估计出声发射源的位置。本发明具有计算处理简单,收敛性能好,定位精度高等优点,从而有效地应用于声发射源定位。

    基于分段投影与乐符结构的谱线检测及删除方法

    公开(公告)号:CN101964049A

    公开(公告)日:2011-02-02

    申请号:CN201010275823.7

    申请日:2010-09-07

    Applicant: 东南大学

    Abstract: 本发明公布了一种基于分段投影与乐符结构的谱线检测及删除方法,纸质乐谱图像首先通过扫描仪或者数码拍摄设备输入到计算机,然后经过去噪,图像格式变换等预处理操作,变成二值乐谱图像;输入图像经过预处理后,首先计算出乐谱的谱线间距,并以此为参考将整幅图像在垂直方向上分割成若干段,通过对部分特殊图像段进行水平投影处理后获取图像的垂直倾斜度,实现谱线垂直方向的倾斜校正,然后对各段进行水平垂直投影,计算相邻两段投影的互相关,进而实现图像水平倾斜以及谱线弯曲的校正,进一步消除二值图像由于倾斜导致部分直线段出现像素重叠的问题。本发明的能有效的解决“误删”和欠删除现象。

    基于乐符知识及双投影法的乐符基元分割方法

    公开(公告)号:CN101944180A

    公开(公告)日:2011-01-12

    申请号:CN201010275635.4

    申请日:2010-09-07

    Applicant: 东南大学

    Abstract: 本发明公布了一种基于乐符知识及双投影法的乐符基元分割方法,对乐谱图像进行连通域分析后尽管能够获得乐谱图像的各个连通域,但由于乐谱符号的空间多样性,通常需要将乐谱对象分割成最基本的基元,以减轻乐谱识别的负担并提高识别率。本发明根据需要分割的各种乐符的结构特点,提出了基于乐符知识及双投影法的基元分割算法。考虑到需要进一步分割的连通域通常包含有符干,因此首先对经过初步分割的所得到的各连通域进行垂直投影,并结合音符结构知识判断是否包含有符干,从而确定哪些连通域需要进一步分割,然后再在此基础上采用水平投影法进行基元分割。

    基于行游程邻接表的乐谱快速连通域分析方法

    公开(公告)号:CN101930544A

    公开(公告)日:2010-12-29

    申请号:CN201010275849.1

    申请日:2010-09-07

    Applicant: 东南大学

    Abstract: 本发明公布了一种基于行游程邻接表的乐谱快速连通域分析方法,所述方法如下,对图像F(x,y)由上至下进行行扫描,记录下各行的黑色游程信息,得到整幅图像的水平黑色游程信息表;建立重要信息统计矩阵向量;判断Yctable中的Flagi是否为1;计算第i行(即下一行)各游程段与第i-1行各游程段的邻接情况;统计游程邻接表第r行(即下一行的第r个游程段所对应的行)中1的个数;去掉废除后连通域编号的其它连通域编号所对应的ltyxsb就是分割后真正的各连通域所对应的像素信息;最后用方框标识出分割区域。

    一种基于心电信号与语音信号的双模态情感识别方法

    公开(公告)号:CN101887721A

    公开(公告)日:2010-11-17

    申请号:CN201010230506.3

    申请日:2010-07-19

    Applicant: 东南大学

    Abstract: 本发明公布了一种基于心电信号与语音信号的双模态情感识别方法,所述方法包括如下步骤:(1)情感数据的采集;(2)情感特征的提取;(3)判决层融合算法:(3-1)待识别的情感类别包括烦躁、喜悦和平静三个类别,对语音与心电分类器均采用高斯混合模型(GMM)来进行每种情感类别的概率模型的训练,高斯混合模型是成员密度的加权和;(4)特征层融合算法:(4-1)采用PCA方法进行语音特征与心电特征的融合与降维;(4-2)采用(3-1)中所述的高斯混合模型进行训练与识别。本发明融合心电和语音进行双模态情感识别;提取心电的混沌特征进行情感识别;识别性能高。

    基于模态波和高斯混合模型的转子碰摩声发射识别方法

    公开(公告)号:CN101566519A

    公开(公告)日:2009-10-28

    申请号:CN200910027182.0

    申请日:2009-05-22

    Applicant: 东南大学

    Abstract: 本发明公布了一种基于模态波和高斯混合模型的转子碰摩声发射信号识别方法,本发明所述方法如下:采用碰摩声发射试验装置获得声发射信号,并对其进行短时分帧;对每个短时帧,分别提取倒谱系数,并计算分形维,将两者共同组成识别碰摩声发射信号的混合特征参数;确定碰摩声发射信号中的模态波种类;对于每一种类型的模态波分别建立一个相对应的高斯混合模型,并将碰摩声发射信号中的每个模态波单独用高斯混合模型进行训练;在识别时对各模态波模型的输出似然比按一定的权值比例合并得到总似然比;最后针对总似然比进行判决。本发明能较准确地识别碰摩声发射信号。该方法不仅能够应用于突发型声发射信号的识别,而且可以应用于连续型声发射信号的识别。

    基于功率谱一阶矩和平滑器的心电信号提取呼吸波形方法

    公开(公告)号:CN113729725B

    公开(公告)日:2024-02-06

    申请号:CN202111157232.4

    申请日:2021-09-30

    Applicant: 东南大学

    Abstract: 本发明专利公开了一种基于功率谱一阶矩和平滑器的心电信号提取呼吸波形方法,该方法首先通过对可穿戴设备上获得心电信号进行预处理,然后对预处理过的心电信号进行R波检测,根据检测出来的R波对每个心拍的QRS波群进行提取,接着基于QRS波群提取兼具显著性和抗噪性的特征,并根据呼吸信号的非平稳特性进行平滑器,最终得到更加准确的呼吸波形。本发明实现了在只有心电监测设备时的呼吸监测,避免了传统呼吸监测设备的笨重和对自然呼吸的干扰,一定程度上减少了受试者的不适,同时不仅引入了具有抗噪性能的特征,还考虑了呼吸非平稳的特性,确保了提取出来的呼吸波形的准确性,增加了在日常活动中呼吸监测的可靠性。

    一种基于注意力机制的自适应微表情识别方法

    公开(公告)号:CN113449661B

    公开(公告)日:2022-11-25

    申请号:CN202110758045.5

    申请日:2021-07-05

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于注意力机制的自适应微表情识别方法,包括如下步骤:对微表情数据库的图像序列进行一系列的预处理工作;每个微表情序列作为一个样本,从每个序列中以一定的间隔选取一定数量的图像,选取的每张图像采用基于运动放大的方法放大1‑9倍;在一组不同的放大图像间添加注意力权重,并将其最终整合成一个特征向量;对于同一序列下的一组图像对应的一组向量,通过注意力机制对这些向量施加不同的注意力权重,再次以相同方式将这些向量整合成一个向量;将最终表示向量送入网络进行训练;获取待识别的微表情图像序列,按照上述方式得到最终表示向量后,输出情感类别。本发明能够获得更高的识别准确率。

Patent Agency Ranking