-
公开(公告)号:CN119740658A
公开(公告)日:2025-04-01
申请号:CN202411772723.3
申请日:2024-12-04
Applicant: 北京邮电大学
IPC: G06N5/04 , G06F16/783 , G06F16/683 , G06F18/25 , G06N3/0464 , G06N3/045
Abstract: 本发明提供一种自动驾驶视频问答方法、模型训练方法及系统,训练样本集对初始自动驾驶问答模型进行训练,每个样本包含针对一个自动驾驶视频的连续视频图像数据、音频数据和问题文本数据;提取的视频特征和音频特征融合并输入场景超图生成模块,与关系查询输入关系解码器获取关系特征,与驾驶行为查询输入驾驶行为解码器获得驾驶行为特征,两类分类头输出两类分类结果;场景超图嵌入层分别对关系特征和驾驶行为特征添加对应分类结果和时间步的嵌入,引入标识嵌入后获得场景超图嵌入,与问题文本特征共同输入视频问答模块,输出关于问题文本数据的答案预测值;通过匈牙利匹配损失函数和交叉熵损失函数构建融合损失函数获得自动驾驶视频问答模型。
-
公开(公告)号:CN119671875A
公开(公告)日:2025-03-21
申请号:CN202411679308.3
申请日:2024-11-21
Applicant: 北京邮电大学
IPC: G06T5/60 , G06N3/0455 , G06N3/0464 , G06N3/084
Abstract: 本申请提供一种图像处理方法、装置、设备、存储介质及程序产品。该方法包括:获取待处理图像、以及待处理图像的语义掩码信息;对待处理图像的语义掩码信息和待处理图像进行结合处理,得到目标语义掩码实例;根据预设的CLIP网络和目标语义掩码实例,得到目标语义掩码实例中的实例语义信息;对实例语义信息和比对实例语义信息进行相似度的比对处理,确定实例语义信息中的目标掩码实例;根据目标掩码实例和待处理图像,确定目标图像。本申请的方法,提高了原始图像的图像质量和图像处理效率。
-
公开(公告)号:CN119204192A
公开(公告)日:2024-12-27
申请号:CN202411706615.6
申请日:2024-11-26
Applicant: 北京邮电大学
IPC: G06N5/022 , G06F18/213 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种基于翻译嵌入的传感数据逻辑特征提取方法及装置,所述方法包括:获取进行逻辑特征提取的传感数据序列,将传感数据序列输入至训练好的逻辑特征提取模型,传感数据序列包括传感器监测到的多个时间步的监测数据,逻辑特征提取模型包括向量嵌入模块、关系构建模块以及特征提取模块;基于向量嵌入模块确定传感数据序列中的各监测数据对应的嵌入向量,基于各嵌入向量通过所述关系构建模块确定监测数据之间的逻辑关系表示,基于各嵌入向量和各逻辑关系表示通过特征提取模块生成各监测数据对应的逻辑特征向量;其中,逻辑关系表示为算术关系表示或方向关系表示。该方法可较好地捕获传感数据中的细微特征,提高数据分析的准确性和实用性。
-
公开(公告)号:CN119169245A
公开(公告)日:2024-12-20
申请号:CN202411345954.6
申请日:2024-09-25
Applicant: 北京邮电大学
IPC: G06V10/20 , G06N3/0464 , G06N3/084 , G06V10/44 , G06V10/764 , G06V10/766 , G06V10/80 , G06V10/82
Abstract: 本申请提供一种基于美学评估的混合曝光处理方法、设备、介质及产品。包括:根据掩码信息,对待校正特征信息进行特征映射处理,得到第一过曝特征信息和第一欠曝特征信息;对第一过曝特征信息和第一欠曝特征信息进行池化卷积处理,得到第二过曝特征信息和第二欠曝特征信息;根据第一过曝特征信息和第二过曝特征信息、第一欠曝特征信息和第二欠曝特征信息,得到目标过曝特征信息和目标欠曝特征信息;根据待校正特征信息、目标过曝特征信息和目标欠曝特征信息,得到融合特征信息;根据融合特征信息和待校正特征图像,得到目标图像。本申请的方法,能够同时识别和处理曝光图像中的欠曝和过曝部分,提高了曝光校正的效率,提升了用户对图像的观感体验。
-
公开(公告)号:CN118093882B
公开(公告)日:2024-11-29
申请号:CN202410495174.3
申请日:2024-04-24
Applicant: 北京邮电大学
IPC: G06F16/35 , G06F40/30 , G06F18/25 , G06F16/583
Abstract: 本申请提供一种基于美学引导的文生图模型优化方法、装置、设备及介质。包括:获取提示文本词汇的提示文本特征、以及目标关键词的关键词特征,将提示文本特征和关键词特征输入至待训练模型中的语义融合模块进行语义融合处理,得到语义融合特征,将语义融合特征输入至待训练模型中的多维分数预测模块进行对齐处理,得到维度预测结果,根据维度预测结果和比对评估结果,对待训练模型进行调整,得到目标模型。该方法用以提高基于关键词的文本生成图像的使用效果。
-
公开(公告)号:CN118194237B
公开(公告)日:2024-10-11
申请号:CN202410447865.6
申请日:2024-04-12
Applicant: 北京邮电大学
IPC: G06F18/25 , G06F18/213 , G06F18/10 , G06N3/0464 , G06N3/0499
Abstract: 本发明提供一种基于太赫兹的数字味蕾感知方法及系统,该方法包括以下步骤:接收由待测物体反射的反馈信号;基于所述反馈信号构建模型输入数据,将所述模型输入数据输入到预训练的两阶段模型中,所述两阶段模型包括味觉种类识别模型和味觉强度识别模型,所述味觉强度识别模型包括对应多个单一味觉的子模型,所述味觉种类识别模型与每个子模型直接均构建有识别通道;所述味觉种类识别模型接收所述模型输入数据,并判定待测物体中包括的味觉种类,基于所述味觉种类识别模型判定的待测物体中包括的味觉种类启动对应的识别通道,并将所述模型输入数据输入到对应的子模型中,每个子模型输出对应该单一味觉的味觉强度。
-
公开(公告)号:CN118521946A
公开(公告)日:2024-08-20
申请号:CN202410991751.8
申请日:2024-07-23
Applicant: 北京邮电大学
IPC: G06V20/40 , G06V10/80 , G06V10/82 , G06V10/94 , G06V10/96 , G06N3/0455 , G06N3/0499 , G06N3/084 , G06N3/096 , H04N21/262 , H04L67/60
Abstract: 本发明提供一种基于连续学习的视联网任务理解与调度方法及系统,该方法包括以下步骤:获取历史时间段的视联网状态,所述视联网状态包括多项资源的状态;将历史时间段中每个历史时间点的每项资源的状态构建为资源状态向量,并输入到预训练的资源需求表征模型中,得到资源特征向量;将多个历史时间点对应的资源特征向量构建为特征组,并输入到预训练的序列化资源需求模型中,得到预测的多个任务的资源需求向量;将预测的资源需求向量对应的任务进行组合,得到多种任务组合,基于多个任务的资源需求向量计算各种任务组合的依赖关系值;基于所述依赖关系值确定最终使用的任务组合,将最终使用的任务组合分配至节点。
-
公开(公告)号:CN118381960A
公开(公告)日:2024-07-23
申请号:CN202410423454.3
申请日:2024-04-09
Applicant: 北京邮电大学
IPC: H04N21/2343 , H04N21/231 , H04N21/4402 , H04N21/433 , H04N21/462 , H04N21/2187
Abstract: 本发明提供一种基于网状多流冗余视频传输系统,包括:视频转发终端接收视频数据包复制到编码缓存区中,并转发至内容分发终端;在复制数量等于预设视频数据包数量的情况下,生成冗余数据包,并将冗余数据包转发至内容分发终端;初始化编码缓冲区;执行响应于接收到的视频数据包,将视频数据包复制到编码缓存区中的步骤;通过内容分发终端在接收到视频数据包或者冗余数据包的情况下,将视频数据包或者冗余数据包分发至至少一个上游终端;通过上游终端,在接收到视频数据包或冗余数据包的情况下,将视频数据包或冗余数据包转发至至少一个下游终端;能够解决上游观众的加入或离开行为打断实时流媒体的传输,导致下游观众观看直播视频体验较差的问题。
-
公开(公告)号:CN118252481A
公开(公告)日:2024-06-28
申请号:CN202410603196.7
申请日:2024-05-15
Applicant: 北京邮电大学
Abstract: 本发明提供一种重搏切迹无关的血压监测算法,其特征在于,包括:舒张压建模;脉压建模;形态无关的血压特征提取以及血压监测算法四个部分;与传统的PTT方法或示波法相比,本发明的设计方法可以在白天和夜间进行连续的血压监测,且舒适度高;相比于最新的深度学习方法,本发明可以更好地适应重搏切迹缺失问题;对收缩压和舒张压估计误差分别为0.01±6.74 mmHg以及0.02±6.27mmHg,满足AAMI标准(美国医疗器械促进协会颁布的评价电子血压计的国际标准:≤5±8mmHg),而其他方法在舍弃掉重搏切迹相关特征后,对舒张压和收缩压的估计误差不满足AAMI标准,本发明的连续血压监测精度高,适合推广应用。
-
公开(公告)号:CN118096626A
公开(公告)日:2024-05-28
申请号:CN202410165178.5
申请日:2024-02-05
Applicant: 北京邮电大学
IPC: G06T5/94 , G06T5/50 , G06V20/40 , G06N3/0455 , G06N3/0464 , G06N3/084 , G06T5/60
Abstract: 本公开提供了一种基于事件的暗光图像增强方法及电子设备,获取初始图像数据,确定初始图像数据对应的事件信息;将初始图像数据及事件信息输入至预先经过训练的暗光图像增强模型;分别对初始图像数据及事件信息进行映射处理,得到图像特征图及事件特征图;将图像特征图输入至光照分量增强模块,利用光照分量增强模块对图像特征图进行增强处理,得到光照分量;将图像特征图及事件特征图输入至反射分量增强模块,利用反射分量增强模块基于事件特征图对图像特征图进行增强处理,得到反射分量;将光照分量及反射分量输入至合成模块中,利用合成模块进行合成处理,得到增强图像数据,实现了图像极暗区域的细节的增强,提高了暗光图像增强的增强效果。
-
-
-
-
-
-
-
-
-