-
公开(公告)号:CN119444912B
公开(公告)日:2025-05-16
申请号:CN202510045748.1
申请日:2025-01-13
Applicant: 北京邮电大学
IPC: G06T11/00 , G06T5/60 , G06T5/70 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/0475
Abstract: 本发明公开了一种交互便捷的多功能图像生成方法,包括:接收输入的图像生成控制条件并预处理;图像生成控制条件包括:文本提示、实体条件图和背景图;通过生成模型对初始噪声图像进行全局引导去噪,获得噪声图像;利用生成模型中的交叉注意力图实现局部控制区域的自适应定位;根据定位后的局部控制区域,对预处理后的实体条件图和背景图进行多层次特征融合,获得多模态编码特征;将多模态编码特征通过视觉控制适配器获得视觉控制特征,与生成模型中的全局中间层特征,共同引导生成模型对噪声图像进行去噪,实现图像生成。该方法解决了多模态图像生成领域中交互不便捷、图像质量差以及功能单一的问题,显著提升了多模态图像生成的性能和用户体验。
-
公开(公告)号:CN108804577B
公开(公告)日:2022-11-01
申请号:CN201810505164.8
申请日:2018-05-24
Applicant: 联通在线信息科技有限公司 , 北京邮电大学
IPC: G06F16/9535 , G06K9/62
Abstract: 本发明公开一种资讯标签兴趣度的预估方法,包括:创建并维护含标签的候选资讯库;根据用户人口学信息得到用户属性资讯标签兴趣度向量;获取预设时间段内多个用户的历史行为数据并进行预处理,得到已训练的深度学习模型;获取当前用户的历史行为数据并进行预处理,得到当前用户的用户行为资讯标签兴趣度向量;根据当前用户的用户属性资讯标签兴趣度向量和用户行为资讯标签兴趣度向量计算得到用户‑资讯标签兴趣度向量,最终确定用户最感兴趣的若干个资讯标签。本发明解决用户兴趣度预估的冷启动问题,避免了直接从互联网中选取资讯时常会出现的资讯质量低的问题,同时降低了对用户兴趣度预估问题的计算量,适用于每个样本含有多个标签的场景。
-
公开(公告)号:CN110837798B
公开(公告)日:2022-10-11
申请号:CN201911072166.3
申请日:2019-11-05
Applicant: 北京邮电大学
IPC: G06V30/226 , G06V10/46
Abstract: 本发明提供了一种基于视觉特性的草图笔画编组方法,包括:输入某一类别多张统一格式后的草图;统计草图中的笔画长度;基于设定阈值将草图中所有笔画长度划分为长笔画、中笔画和短笔画;将长笔画切分为中笔画和/或短笔画;根据得分计算规则对同一张草图中的所有笔画计算得分,得到得分矩阵;根据得分矩阵进行笔画编组;判断所有笔画是否完成笔画编组;完成笔画编组时,结束编组结束;未完成笔画编组时,根据编组结果,增加得分计算项,更新得分矩阵后计算得分矩阵进行笔画编组。本发明利用计算机学习手绘草图的视觉信息和时序信息,解决草图语义分割的问题,使其尽可能接近人类的认知水平,同时在一个计算模型中,可以同时协同多种编组特性。
-
公开(公告)号:CN109919124B
公开(公告)日:2021-01-29
申请号:CN201910206774.2
申请日:2019-03-19
Applicant: 北京邮电大学 , 首都医科大学附属北京安定医院 , 北京红云智胜科技有限公司
IPC: G06K9/00
Abstract: 快速构建人脸动作单元识别数据集的方法,包括:标注手册的建立;AU的选定与处理;选定与步骤二相同的待标注AU和标注成员分组方式;本发明采用机器标注+人工修正、分组标注、多一致性准则和标注样例集的方法,在尽量减少人工标注成本的同时,保证了标注准确性,降低了标注复杂性,保持了不同标注人员的一致性,该方法能够在较短的时间内快速构建人脸动作单元识别数据集,极大的降低了人力成本,且很好的解决了现有技术中,多人标注时一致性难以统一的不足。
-
公开(公告)号:CN110808096A
公开(公告)日:2020-02-18
申请号:CN201911045403.7
申请日:2019-10-30
Applicant: 北京邮电大学
Abstract: 本发明基于卷积神经网络的心脏病变自动检测系统,其特征在于,包括:数据库、病变信息处理模块、关键帧提取模块、数据清洗模块、信息融合及存储模块、卷积神经网络学习模块、模型存储及筛选模块以及病变检测模块;涉及深度学习、医疗以及计算机视觉等领域,通过科学优化的设计,创建并实现了一套基于卷积神经网络的心脏冠状动脉钙化、完全闭塞及血栓病变全自动智能检测系统,针对诊断对结果准确率以及时效性的需求,设计结构巧妙,无需任何人工辅助便可以输出高质量辅助诊断检测结果,为冠状动脉患者以及医生带来便利。
-
公开(公告)号:CN103871411A
公开(公告)日:2014-06-18
申请号:CN201410134694.8
申请日:2014-04-03
Applicant: 北京邮电大学
Abstract: 本发明实施例公开了一种基于线谱频率差值的文本无关的说话人鉴别方法。该方法包括如下步骤:特征提取步骤:将线谱频率参数通过线性变换转化为线谱频率参数差值,结合当前帧和其前后相邻两帧形成一个生成线谱频率特征超向量;模型训练步骤:使用超狄利克雷混合模型模拟特征超向量的分布,并解出模型中的参数;鉴别步骤:对待鉴别人的语音序列按照步骤一提取特征,再输入步骤二所得到的模型,计算针对每个概率模型的似然值,获取最大似然值,确认说话人编号。利用本发明实施例,能够提高文本无关的说话人鉴别率,具有很大的实用价值。
-
公开(公告)号:CN102404694A
公开(公告)日:2012-04-04
申请号:CN201110432513.6
申请日:2011-12-21
Applicant: 北京国基科技股份有限公司 , 北京邮电大学
Abstract: 本发明公开了一种多媒体集群调度指挥系统、移动终端及语音通话方法,包括:集群服务器、调度指挥平台和多个多媒体移动终端;集群服务器分别与调度指挥平台和多媒体移动终端连接;多媒体移动终端包括:录音设备,用于在多媒体移动终端具备首长呼叫权限并启用首长模式进行语音通话时开启,获取语音通话的语音包;语音缓冲设备,与录音设备连接,用于存储录音设备获取的语音包;语音发送设备,与语音缓冲设备连接,用于在录音设备获取的语音包能量大于阈值时,发送语音缓冲设备存储的语音包;在发送的语音包能量不大于阈值时,停止发送语音包。采用本发明可以灵活方便地在集群系统使用多媒体移动终端并保证指挥决策及时准确。
-
公开(公告)号:CN1438604A
公开(公告)日:2003-08-27
申请号:CN02157957.1
申请日:2002-12-23
Applicant: 北京邮电大学
Abstract: 本发明公开了一种基于贝叶斯分类器的文字字体判断设备及其方法。所述的设备包括:文字图像输入装置与前端处理装置、特征提取器、训练样本存储器、PCA分析器,PCA变换器、分类器参数估计器、贝叶斯分类器、可信度估计装置、判断结果输出装置和控制处理器。根据训练样本,利用统计处理方法自动学习知识,从而准确判断文字字体的设备。该设备结构化好,操作简单,判别精度高,并且对于被印章和底纹严重污染的文字,同样可以获得高精度,只需4~5个汉字即可准确判断字体,而且人工设定参数少,不依赖人的经验,回避了复杂而且容易出错的文字切分步骤,不需要对图像进行二值化。该设备适用于对识别精度要求严格的文字识别系统中,如银行支票识别系统、信函地址识别系统、表格识别系统等。
-
公开(公告)号:CN202374454U
公开(公告)日:2012-08-08
申请号:CN201120541117.2
申请日:2011-12-21
Applicant: 北京国基科技股份有限公司 , 北京邮电大学
Abstract: 本实用新型公开了一种多媒体集群调度指挥系统及多媒体移动终端,包括:集群服务器、调度指挥平台和多个多媒体移动终端;集群服务器分别与调度指挥平台和多媒体移动终端连接;多媒体移动终端包括:录音设备,用于在多媒体移动终端具备首长呼叫权限并启用首长模式进行语音通话时开启,获取语音通话的语音包;语音缓冲设备,与录音设备连接,用于存储录音设备获取的语音包;语音发送设备,与语音缓冲设备连接,用于在录音设备获取的语音包能量大于阈值时,发送语音缓冲设备存储的语音包;在发送的语音包能量不大于阈值时,停止发送语音包。采用本实用新型可以灵活方便地在集群系统使用多媒体移动终端并保证指挥决策及时准确。
-
公开(公告)号:CN202374453U
公开(公告)日:2012-08-08
申请号:CN201120541108.3
申请日:2011-12-21
Applicant: 北京国基科技股份有限公司 , 北京邮电大学
Abstract: 本实用新型公开了一种数字集群系统及其集群调度服务器、电话服务器,数字集群系统包括:集群调度服务器,用于在接收到对第一用户进行管理的请求后,生成针对第一用户终端的相应的执行消息,并发送给电话服务器,所述第一用户终端归属于第一用户;电话服务器,用于在接收到集群调度服务器的执行消息后,根据执行消息的内容向第一用户终端拨打相应类型的电话;管理模块,位于第一用户终端,用于在监听到电话服务器拨打的电话时,根据拨打的类型对第一用户终端进行相应的管理操作。本实用新型可以基于数字集群系统实现对用户终端的管理,有利于提高应用行业应对紧急突发事件的能力,大大提高了数字集群系统的实用性。
-
-
-
-
-
-
-
-
-