-
公开(公告)号:CN104011739A
公开(公告)日:2014-08-27
申请号:CN201280065062.X
申请日:2012-10-19
Applicant: 北京航空航天大学
IPC: G06K9/00
CPC classification number: G06K9/00315 , G06K9/6297
Abstract: 一种基于趋势一致高斯过程隐变量模型的面部运动信息提取方法,其中趋势一致高斯过程隐变量模型描述如下:(1)构造基于马尔可夫假设的求解低维隐变量序列高斯过程隐变量模型目标函数;(2)添加趋势一致限制条件构造趋势一致高斯过程隐变量模型目标函数。其中基于趋势一致的高斯过程隐变量模型的面部运动信息提取,具体方法描述如下:(1)采用主成分分析方法(PCA)得到用于趋势一致高斯过程隐变量模型目标函数的面部序列隐变量空间初始值;(2)采用尺度共轭梯度法(Scaled Conjugate Gradient)求解隐变量,得到对应面部运动序列的低维隐变量序列。该方法在提取与身份信息无关的运动信息同时,保留由于面部运动幅度不同产生的隐空间序列变化范围差异。
-
公开(公告)号:CN103279055A
公开(公告)日:2013-09-04
申请号:CN201310119352.4
申请日:2013-04-08
Applicant: 北京航空航天大学
IPC: G05B19/042
Abstract: 本发明提出了一种用于连接Arinc708板卡与FPGA开发板的转接板设计方案。可概括为:步骤一:测试Arinc708板卡输出波形的电压,得到的是峰峰值为6.6V的模拟差分信号;步骤二:对6.6V的模拟差分电压进行降压和电平转换,得到高电平为3.3V的数字信号,作为FPGA的输入信号。用到的芯片是PM-DB2725EX和HI-1570PSI;步骤三:电源模块的设计,本设计采用了220V转5V的电源接口和一个5V转3.3V的稳压芯片AMS1117-3.3;步骤四:测试Arinc708与FPGA之间的通信,结果表明本发明很好的解决了Arinc708板卡与FPGA开发板连接时的电平匹配问题。
-
公开(公告)号:CN103246395A
公开(公告)日:2013-08-14
申请号:CN201310122676.3
申请日:2013-04-10
Applicant: 北京航空航天大学
IPC: G06F3/041
Abstract: 本发明提出了一种基于mini2440开发板的触摸屏校正方法,其包括:步骤一:基于mini2440开发板的四线制电阻式触摸屏产生误差的原因提出了触摸屏的9点校正算法,并给出了公式推导过程;步骤二:根据开发板上触摸屏工作方式和9点校正算法,说明了触摸屏的校正程序的基本思想,并给出了针对于mini2440开发板的触摸屏校正程序的流程图;步骤三:根据程序运行的结果,得到了相应的参数,并给出了校正公式。本发明的创新点在于提出的校正方法相比于其它的触摸屏校正方法,误差更小,有更好的鲁棒性。
-
公开(公告)号:CN115147303A
公开(公告)日:2022-10-04
申请号:CN202210767690.8
申请日:2022-06-30
Applicant: 首都医科大学附属北京世纪坛医院 , 北京航空航天大学
Inventor: 白文佩 , 赵琦 , 杨敏 , 陈立江 , 乔长坤 , 蔡凌翰 , 吕书畅 , 李孟豪 , 郭晨旭 , 吴美静 , 刘秉昊 , 陈明皇 , 高佩佩 , 杨慕坤 , 尹聪 , 陈雁容
Abstract: 本发明提供一种基于掩膜引导的二维超声医学图像修复方法,以二维卵巢超声图像修复为例,方法包括步骤:采集二维卵巢超声图像;通过标注生成二值掩膜,建立数据集;将数据集划分为训练集和测试集;通过生成随机二值掩膜,将训练集中的超声图像加工成破损图像;将训练集中的原始图像和二值掩膜加载到图像修复模型中进行训练,计算模型的损失,反向传递至网络中,进行模型参数的调整,反复迭代优化训练,得到最优的图像修复模型。利用最优的模型对破损的超声图像进行修复。通过以上步骤,实现二维超声医学图像的修复,提高针对二维卵巢超声图像中病灶识别和分割结果的准确率。
-
公开(公告)号:CN114360694A
公开(公告)日:2022-04-15
申请号:CN202210034545.9
申请日:2022-01-13
Applicant: 首都医科大学附属北京世纪坛医院 , 北京航空航天大学
Inventor: 白文佩 , 赵琦 , 杨敏 , 陈立江 , 吕书畅 , 蔡凌翰 , 吴美静 , 乔长坤 , 李孟豪 , 陈明皇 , 尹聪 , 杨慕坤 , 章静菲 , 杨东 , 桑秀波 , 刘冬梅 , 顾小宁
Abstract: 本发明提供一种卵巢肿瘤多模态超声影像人工智能数据库及其构建方法,该方法包括步骤:利用超声设备获取病人的卵巢肿瘤二维超声影像和超声造影视频,数据上传至信息中心,从信息中心获取数据的第一时间隐去病人的所有隐私信息;从信息中心获取超声造影视频数据,对超声造影视频进行视频抽帧,选取病灶区域明显的二维超声影像保存,同时保存原始超声造影视频数据;基于疾病诊断,对于二维超声影像和抽帧后的超声造影单帧影像进行代表肿瘤类别的全局标签标注;使用LabelImg开源标注软件对二维超声影像和超声造影单帧影像进行分割区域的语义标签标注;根据肿瘤类别(全局标签),对采集的多模态超声影像数据及对应标注进行分类存储。通过以上步骤,实现了卵巢肿瘤多模态超声影像人工智能数据库的构建。该发明提供的数据库推动了AI影像学结合卵巢肿瘤早诊早治的发展,填补了国内外在卵巢肿瘤多模态超声影像人工智能数据库方面的空白。该发明提供的“数据采集‑数据规范化标注‑数据分类管理”的构建方法,也为卵巢肿瘤影像学领域的数据库构建提供了标准和规范。
-
公开(公告)号:CN112188229A
公开(公告)日:2021-01-05
申请号:CN202011068523.1
申请日:2020-10-09
Applicant: 北京航空航天大学
IPC: H04N21/2187 , H04N21/431 , H04N21/4782 , H04N21/488 , H04N21/6437
Abstract: 本发明提供一种基于WEB的高兼容度交互式直播视频处理系统,步骤如下:一、通过文件或手动设定一路或多路直播视频流RTMP地址;二、使用canvas和video.js实现网页端交互式标定画面中关注的一个或多个区域的任意四边形顶点坐标;三、利用中心投影变换将标定的任意四边形变换为标准矩形;四、利通过预留接口连接所需的任意实时视频处理算法,将变换后的矩形直播画面传入算法进行处理;五、使用MySQL数据库存储算法获得的所需要的离线视频选段,使用网页播放或PC端视频播放器向呈现该的视频内容。通过以上步骤,提高了直播视频处理系统的拓展性、跨平台性能和交互性,简化直播视频处理算法的平台部署流程并增强了直播视频处理系统的使用友好性。
-
公开(公告)号:CN107993663A
公开(公告)日:2018-05-04
申请号:CN201710809811.X
申请日:2017-09-11
Applicant: 北京航空航天大学
Abstract: 本发明一种基于Android的声纹识别方法,运行在Android操作系统中,通过调用内置录音设备采集训练说话人音频并进行语音增强,训练时构建矢量量化模型的kd树以及高斯混合模型。识别时在矢量量化模型的kd树中搜索出与测试说话人声纹特征最接近的K个训练说话人后,利用高斯混合模型进行精确识别。本发明利用矢量量化模型的kd树不仅避免了遍历高斯混合模型库中的所有模型,增加了识别速度,而且利用矢量量化模型和高斯混合模型的二次识别增加了识别的准确度,具有很强的实用性、易用性和鲁棒性。
-
公开(公告)号:CN104795077B
公开(公告)日:2018-02-02
申请号:CN201510115470.7
申请日:2015-03-17
Applicant: 北京航空航天大学
IPC: G10L25/60
Abstract: 本发明提供一种检验语音标注质量的一致性检测方法,该方法包括以下步骤:1)标注文件为TextGrid格式,将标注形式分为三种,并根据三种不同的标注形式,设计了三种相应的一致性检测公式。2)对含有六层标注信息的文件进行一致性检测,六层信息分别是:音节层(PY层)、声韵母层(SY层)、清音浊音静音层(SUV层)、副语言信息层(PARAL层)、情感层(EMO层)、重音指数层(ST层)。3)根据标注层的标注形式,选择对应的一致性计算公式。4)设定时间误差T0,两名标注者标注内容相同且时间误差小于等于T0的则认为标注结果一致,否则认为不一致,依次计算各层的一致性。本发明一致性检测方法是检验语音数据库标注质量的基础,为自动语音标注质量和手动标注质量的检验提供了一种有效的检测方法。
-
公开(公告)号:CN104732981B
公开(公告)日:2018-01-12
申请号:CN201510115476.4
申请日:2015-03-17
Applicant: 北京航空航天大学
IPC: G10L21/0208 , G10L25/63 , G10L25/93
Abstract: 本发明提供了一种结合电声门图的汉语语音情感数据库的语音标注方法。该语音标注方法的主要标注内容包括对每条语音同时标注八层信息:第一层,文字转换层,明确说话人说话内容及相应的副语言信息;第二层,音节层,标注每个音节的正则拼音和声调;第三层,声韵母层,将音节层的声韵母分开标注,同时标明声调信息;第四层,清音浊音静音层,结合电声门图对语音的清浊静音的进行分割;第五层,副语言信息层,标注每条语音包含的副语言信息;第六层,情感层,根据说话人表达的情感状态,每条语音都标注包含有七种情感信息并标注每种情感的表达程度;第七层,重音指数层,标注每个音节发音的强度信息;第八层,语句功能层,标注每条语句的语句类型。
-
公开(公告)号:CN102682456B
公开(公告)日:2014-07-16
申请号:CN201210123982.4
申请日:2012-04-25
Applicant: 北京航空航天大学
IPC: G06T11/20
Abstract: 本发明提出了一种基于非加权区域采样的反走样直线绘制方法,对所绘制直线通过光栅图形显示屏的每一列的操作可概括为:(1)通过绘制直线的Bresenham算法确定当前列距离理想直线最近的三个显示像元,其中距离直线最近的显示像元必有灰度值,另外两个显示像元可能有灰度值,而当前列其余显示像元则没有灰度值;(2)将这三个显示像元中的每一个都均分为数量等同于光栅显示屏灰度级数的子像元;(3)通过Bresenham算法分别确定与代表直线的矩形的两条边距离最近的两组子像元,这两组子像元给出代表直线的矩形在当前列中覆盖区域的边界;(4)分别统计三个显示像元被矩形区域覆盖的子像元的数量;(5)根据统计所得结果确定当前列显示像元的灰度值。该方法适用于具有多灰度级的光栅显示屏,通过控制灰度值的缓慢变化达到反走样的效果,非常适合于对显示质量要求较高的仪器仪表等领域。
-
-
-
-
-
-
-
-
-