-
公开(公告)号:CN102819744B
公开(公告)日:2014-09-10
申请号:CN201210225169.8
申请日:2012-06-29
Applicant: 北京理工大学
CPC classification number: G06K9/6289 , G06K9/00302 , G06K9/6296 , G10L17/26 , G10L25/63
Abstract: 本发明提出的一种双通道信息融合的情感识别方法,属于自动情感识别领域。其基本思想是:从情感视频数据中提取脸部表情和语音特征数据;然后使用脸部表情特征数据初始化Boltzmann拉链中慢链的可见节点的状态值;使用语音特征数据初始化Boltzmann拉链中快链的可见节点的状态值,对BOLTZMANN拉链进行训练;使用训练好的BOLTZMANN拉链识别情感视频的情感类别。本发明使用Boltzmann拉链来融合紧密耦合的语音-视觉模态,有效利用了两个通道的内在关联,解决了两个通道数据不同的时间尺度问题,并在训练过程中避免了局部能量极小,实验结果证明了该方法的高准确率和有效性。
-
公开(公告)号:CN104002942A
公开(公告)日:2014-08-27
申请号:CN201410253181.9
申请日:2014-06-09
Applicant: 北京理工大学
Inventor: 贾云得
Abstract: 本发明涉及一种微型自主潜水器,属于无人潜水器和水下机器人领域,由通讯模块1、传感模块2、导航模块3、视觉模块4、推进模块5、控制模块6、中央模块7、电池组8、主壳体9组成,通讯模块1、传感模块2、导航模块3、视觉模块4、控制模块6在中央模块7的统一管理下,协调工作完成预定任务,推进模块5在控制模块6的控制下完成悬停、前行或后退等运动。通讯模块1、传感模块2、导航模块3、视觉模块4、推进模块5、控制模块6、中央模块7均安装于主壳体9上,由电池组8进行供电。该潜水器具有隐蔽性、机动性、智能性、低成本等特点,可以进行远距离作业,可用于水下考古、水下探险等领域,适用范围广泛。
-
公开(公告)号:CN103942560A
公开(公告)日:2014-07-23
申请号:CN201410035329.1
申请日:2014-01-24
Applicant: 北京理工大学
Abstract: 一种智能交通监控系统中的高分辨率视频车辆检测方法。本发明属于智能交通和视频监控技术领域,涉及一种基于高分辨率视频的车辆检测方法。本发明结合智能交通系统的实际应用情况,将视频车辆检测问题视为车头(或车尾)区域的检测问题,为便于描述以车头区域为例;首先在高分辨率监控视频中设置车辆检测的感兴趣区域,利用感兴趣区域中的梯度密度信息和车头区域的结构信息生成一系列的候选区域;使用监督学习方法离线训练车辆与背景的二分类器,其中正样本满足车头的结构约束;使用分类器对候选区域进行验证,将分类为车辆的候选区域标记为车辆区域;使用聚类方法滤除误检并合并多个检测结果,得到最终的车辆检测结果。本发明可以有效地去除误检,提高车辆检测的准确率;操作简单,应用前景广阔。
-
公开(公告)号:CN101867601B
公开(公告)日:2012-08-15
申请号:CN201010175482.6
申请日:2010-05-14
Applicant: 北京理工大学
Abstract: 本发明涉及一种文件级P2P网络流量识别方法,属于网络技术领域。本发明在现有深层数据包检测技术的基础上,根据对数据包所标识的P2P协议类型,从该数据包的有效载荷中提取文件哈希信息。本发明方法由于提取了P2P流传输的具体文件信息,识别的粒度更细。使用本发明提供的方法,网络管理者能采取更有效的措施来管理P2P流量;此外,本发明方法识别出来的文件信息还能用于判断该文件合法性,分析资源的关注程度和用户的下载行为等趋势。
-
公开(公告)号:CN101950249B
公开(公告)日:2012-05-23
申请号:CN201010225984.5
申请日:2010-07-14
Applicant: 北京理工大学
Abstract: 本发明涉及一种默声音符编码字符输入方法,包括以下步骤:1)使用默声音符对字符进行编码;2)使用接触式传感器测量发出默声音时经身体组织传导的声道振动信号,从中识别出默声音符,将默声音符序列解码为字符,实现字符输入;其中,默声音是指用户发出的轻耳语声,发声时周围的人很难听到的声音;默声音符是指默声音中容易发声且容易被精准识别的音素。本发明还提供了一种默声音符编码字符输入装置。本发明所述输入方法不会让语言内容外泄出去,保密性强;不会对周围环境产生噪声;可以在任意嘈杂的环境中实现可靠的语音文字输入;在字符输入过程中,完全解放双手和眼睛;应用广泛、使用方便,并可应用于移动便携设备中。
-
公开(公告)号:CN101605129B
公开(公告)日:2012-02-01
申请号:CN200910087509.3
申请日:2009-06-23
Applicant: 北京理工大学
Abstract: 本发明涉及网络信息安全技术领域,具体涉及一种统一资源定位符(Uniform Resource Locator,URL)的查找方法。本发明将已有URL查找方法中的哈希方法与多字符串匹配的方法相结合,提出一种能很好的满足URL过滤系统性能和功能需求的URL查找方法。与已有查找方法相比,本发明的一种用于URL过滤系统的URL查找方法查找速度快、性能稳定;存储效率高,能满足不断增大的URL黑名单的存储要求;支持前缀匹配。本发明适用于URL过滤系统,能够方便的实现对用户上网行为的有效控制,还可以应用于其他网络应用,如搜索引擎、web缓存、第七层交换等。
-
公开(公告)号:CN102004549A
公开(公告)日:2011-04-06
申请号:CN201010558253.2
申请日:2010-11-22
Applicant: 北京理工大学
Abstract: 一种自动唇语识别系统,包括:头戴式摄像头、人机交互模块、唇部轮廓定位模块、几何向量获取模块、运动向量获取模块、特征矩阵构造模块、变换矩阵T获取模块、转换特征矩阵获取模块、存储器A、存储器B、典型相关判别分析模块。头戴式摄像头用来录制汉字发音图像序列,通过人机交互模块传输至唇部轮廓定位模块,其使用卷积虚拟静电场Snake模型从中检测及跟踪唇部轮廓;几何向量获取模块和运动向量获取模块从唇部轮廓中分别提取出几何和运动特征,并将它们联合起来作为典型相关判别分析模块的输入特征矩阵;典型相关判别分析模块计算特征矩阵间的相似度,处理后获取识别结果。本发明系统与已有唇语识别系统相比较,具有更高的识别准确率。
-
公开(公告)号:CN1186744C
公开(公告)日:2005-01-26
申请号:CN02125949.6
申请日:2002-08-06
Applicant: 北京理工大学
IPC: G06K9/72
Abstract: 本发明涉及基于结构模型的汉字识别方法,属于模式识别、人工智能和中文信息处理领域。本发明采用笔段和笔划两种基元分别建立两种描述汉字结构的数学模型:笔段中心点模型和笔划关系矩阵模型,并建立了笔段中心点识别法和笔划关系矩阵识别法。将笔段中心点识别法和笔划矩阵识别法相结合,用笔段中心点识别法进行汉字识别粗分类,用笔划矩阵识别法进行汉字识别细分类,形成一套完整的汉字识别方法。该方法以统一的机制处理印刷体汉字识别和手写体汉字识别,既可用于脱机识别,也可用于联机识别,识别正确率高,性能稳定。
-
公开(公告)号:CN1474351A
公开(公告)日:2004-02-11
申请号:CN02125949.6
申请日:2002-08-06
Applicant: 北京理工大学
IPC: G06K9/72
Abstract: 本发明涉及基于结构模型的汉字识别方法,属于模式识别、人工智能和中文信息处理领域。本发明采用笔段和笔划两种基元分别建立两种描述汉字结构的数学模型:笔段中心点模型和笔划关系矩阵模型,并建立了笔段中心点识别法和笔划关系矩阵识别法。将笔段中心点识别法和笔划矩阵识别法相结合,用笔段中心点识别法进行汉字识别粗分类,用笔划矩阵识别法进行汉字识别细分类,形成一套完整的汉字识别方法。该方法以统一的机制处理印刷体汉字识别和手写体汉字识别,既可用于脱机识别,也可用于联机识别,识别正确率高,性能稳定。
-
公开(公告)号:CN1136738C
公开(公告)日:2004-01-28
申请号:CN02100547.8
申请日:2002-01-31
Applicant: 北京理工大学
IPC: H04N15/00
Abstract: 一种微型实时立体视觉机,属于机器视觉领域。由立体视觉成像头、立体视觉信息处理器、控制器/通讯接口组成。立体视觉成像头中所有图象传感器同步获取图象,且其摄象机的对角线视场角达140度;立体视觉信息处理器以一片FPGA作为处理芯片,完成图象变形校正、LoG滤波、SSAD计算和子象素级深度计算,实现稠密深度图实时恢复;控制器/通讯接口由DSP和1394通讯芯片组成,用于实现深度图和灰度图象的存储、显示和传输,也用于深度图的高层处理以及依据深度图和灰度图象的控制指令生成。该立体视觉机体积小,运行速度快,视场角大,能实现仿人机器人、自主车辆等系统的视觉感知;也可实现基于深度图的目标分割和跟踪,完成可靠鲁棒的视频监控任务。
-
-
-
-
-
-
-
-
-