-
公开(公告)号:CN102685469A
公开(公告)日:2012-09-19
申请号:CN201210137062.8
申请日:2012-05-04
Applicant: 北京航空航天大学
Abstract: 本发明提出了一种基于MPEG-2 AAC及H.264音视频传输码流的组帧方法。该组帧方法主要包括:编码器提取MPEG-2 AAC音频数据帧帧头的有效信息以及H.264视频数据帧帧头的有效信息,组合成音视频数据帧的可变帧头;添加2个字节的固定帧头和2个字节的帧尾;对固定帧头、可变帧头、帧尾进行海明编码;对MPEG-2 AAC音频数据帧帧头、H.264视频数据帧帧头进行海明编码;从各海明码中分离出校验位数据,依次存入数据填充区;为保证数据帧的完整性在字节对齐区填充若干个0。该组帧方法的鲁棒性好,在保证帧格式完整性的前提下,对固定帧头、可变帧头、帧尾、MPEG-2 AAC音频数据帧帧头及H.264视频数据帧帧头具有一定的纠错能力。
-
公开(公告)号:CN101958895A
公开(公告)日:2011-01-26
申请号:CN201010287715.1
申请日:2010-09-19
Applicant: 北京航空航天大学
Abstract: 本发明一种适合于多路话音编解码设备的网络控制方法,多路话音编解码设备作为以太网服务器端,上位机作为客户端。服务器端在无客户端控制请求时,由硬件开关控制多路话音编解码设备的工作状态,在接收到客户端控制请求时,由客户端控制多路话音编解码设备的工作状态并且该设备定时向客户端进行状态反馈;本发明还涉及一种网络控制系统,包括服务器端的FPGA软硬件设计和客户端的控制程序设计。本发明能够降低成本、具有很强的实用性、易用性和鲁棒性。
-
公开(公告)号:CN118942679A
公开(公告)日:2024-11-12
申请号:CN202411003019.1
申请日:2024-07-25
Applicant: 北京航空航天大学
IPC: G16H50/20 , G16H10/60 , G06F18/243 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/084 , G06N5/01 , G06N20/00
Abstract: 本发明提供一种基于多模态数据的胸部病理人工智能聚合预测方法,包括将来自不同模态的原始医疗数据转换成适合处理的格式、建立三种机器学习通用模型训练、分别提取病人多模态特征嵌入并输入模型进行胸部病理聚合预测、计算不同数据源的Shapley值和分析每个模态对于模型性能的影响。本发明提供了一种基于多模态数据的人工智能聚合预测方法,能够成为临床实践和医疗诊断的辅助工具,提高临床诊断效率及准确率。
-
公开(公告)号:CN104011739B
公开(公告)日:2017-02-15
申请号:CN201280065062.X
申请日:2012-10-19
Applicant: 北京航空航天大学
IPC: G06K9/00
CPC classification number: G06K9/00315 , G06K9/6297
Abstract: 一种基于趋势一致高斯过程隐变量模型的面部运动信息提取方法,其中趋势一致高斯过程隐变量模型描述如下:(1)构造基于马尔可夫假设的求解低维隐变量序列高斯过程隐变量模型目标函数;(2)添加趋势一致限制条件构造趋势一致高斯过程隐变量模型目标函数。其中基于趋势一致的高斯过程隐变量模型的面部运动信息提取,具体方法描述如下:(1)采用主成分分析方法(PCA)得到用于趋势一致高斯过程隐变量模型目标函数的面部序列隐变量空间初始值;(2)采用尺度共轭梯度法(Scaled Conjugate Gradient)求解隐变量,得到对应面部运动序列的低维隐变量序列。该方法在提取与身份信息无关的运动信息同时,保留由于面部运动幅度不同产生的隐空间序列变化范围差异。
-
公开(公告)号:CN103077531B
公开(公告)日:2015-11-18
申请号:CN201210514733.8
申请日:2012-12-04
Applicant: 北京航空航天大学
Abstract: 一种基于边缘信息的灰度目标自动跟踪方法,步骤为:(1)对灰度目标图像进行预处理,包括图像去噪和Sobel微分算子滤波;(2)利用预处理后的灰度目标图像建立边缘信息特征空间;(3)提取目标边缘信息作为特征模版;(4)利用目标直方图计算候选目标的反向投影,并以此描述候选目标;(5)利用Kalman滤波器预测当前帧中目标的起始搜索位置;(6)利用Mean Shift方法在Kalman滤波器预测的目标起始位置附近搜索目标的最优位置;(7)结合Canny算子对目标区域进行更新。本方法充分利用目标的边缘信息,在目标形状、尺寸、灰度分布以及背景发生变化的情况下,实现了对灰度目标快速、稳健的跟踪。
-
-
公开(公告)号:CN103077531A
公开(公告)日:2013-05-01
申请号:CN201210514733.8
申请日:2012-12-04
Applicant: 北京航空航天大学
Abstract: 一种基于边缘信息的灰度目标自动跟踪方法,步骤为:(1)对灰度目标图像进行预处理,包括图像去噪和Sobel微分算子滤波;(2)利用预处理后的灰度目标图像建立边缘信息特征空间;(3)提取目标边缘信息作为特征模版;(4)利用目标直方图计算候选目标的反向投影,并以此描述候选目标;(5)利用Kalman滤波器预测当前帧中目标的起始搜索位置;(6)利用Mean Shift方法在Kalman滤波器预测的目标起始位置附近搜索目标的最优位置;(7)结合Canny算子对目标区域进行更新。本方法充分利用目标的边缘信息,在目标形状、尺寸、灰度分布以及背景发生变化的情况下,实现了对灰度目标快速、稳健的跟踪。
-
公开(公告)号:CN102194459B
公开(公告)日:2013-01-30
申请号:CN201110121871.5
申请日:2011-05-11
Applicant: 北京航空航天大学
IPC: G10L19/028
Abstract: 本发明提出了一种在AVS音频编码过程中嵌入隐藏信息的方法。其包括:步骤一:将待嵌入信息按矢量形式进行分组;步骤二:将经过矢量分组后的待嵌入信息输入量化与数据嵌入模块;步骤三:在量化与数据嵌入模块中完成信息的嵌入并通过修改比例因子控制量化噪声;步骤四:按照每帧量化数据中嵌入隐藏信息的数量修改相应密钥K(i)。在对隐藏信息进行合理分组的前提下,该方法的鲁棒性与安全性是较好的,且由于使用了修改比例因子以降低量化噪声的方案,嵌入信息后的AVS音频也能保持良好的音质。
-
公开(公告)号:CN101958895B
公开(公告)日:2012-11-07
申请号:CN201010287715.1
申请日:2010-09-19
Applicant: 北京航空航天大学
Abstract: 本发明一种适合于多路话音编解码设备的网络控制方法,多路话音编解码设备作为以太网服务器端,上位机作为客户端。服务器端在无客户端控制请求时,由硬件开关控制多路话音编解码设备的工作状态,在接收到客户端控制请求时,由客户端控制多路话音编解码设备的工作状态并且该设备定时向客户端进行状态反馈;本发明还涉及一种网络控制系统,包括服务器端的FPGA软硬件设计和客户端的控制程序设计。本发明能够降低成本、具有很强的实用性、易用性和鲁棒性。
-
公开(公告)号:CN102750950A
公开(公告)日:2012-10-24
申请号:CN201210211283.5
申请日:2011-09-30
Applicant: 北京航空航天大学
Abstract: 本发明一种结合声门激励和声道调制信息的汉语语音情感提取及建模方法,该汉语声门激励信息的提取方法为:制定电声门图情感语音数据库规范;收集电声门图情感语音数据;电声门图情感语音主观评测,即由至少十名评测者对电声门图情感语音进行评测。结合声门激励和声道调制信息的汉语情感建模方法为:首先根据电声门图提取声门激励信息;其次根据电声门图和语音信号的关系提取语音信号中的声道调制信息;最后,利用所有备选特征的Fisher比率为每种情感选择合适的情感特征,并训练一对多支持向量机模型。本发明通过电声门图信号提取声门激励信息,将语音信号中的声门激励信息和声道调制信息分离,更准确的反映语音中的情感信息。
-
-
-
-
-
-
-
-
-