-
公开(公告)号:CN118351235A
公开(公告)日:2024-07-16
申请号:CN202410352394.0
申请日:2024-03-26
Abstract: 本申请提出一种三维重建方法、装置、设备及存储介质,该方法包括:获取待重建物体在稀疏视角下各视角对应的偏振图像;基于各偏振图像,计算各视角的出射斯托克斯向量;基于各视角的出射斯托克斯向量对各视角下任一点的法向量和光强进行约束,得到针对各视角下任一点的约束结果;基于各视角下所有点的约束结果,对待重建物体进行重建。本申请实施例在物体的重建过程中对物体的各个点进行法向量约束和光强约束,即在重建过程中利用了视角中的几何信息和光度信息,可以在稀疏视角条件下对高反光率的物体进行重建,提高重建物体的完整性。
-
公开(公告)号:CN118796629A
公开(公告)日:2024-10-18
申请号:CN202410169169.3
申请日:2024-02-06
Applicant: 中国移动通信有限公司研究院 , 北京邮电大学 , 中国移动通信集团有限公司
Abstract: 本申请公开了一种测试方法、装置、系统、电子设备及可读存储介质,属于云计算技术领域。本申请实施例中的测试方法包括:获取测试设备执行测试任务时得到的测试视频;对所述测试视频进行粗粒度分析,获得粗粒度测试报告;将所述测试视频和所述粗粒度测试报告上报给云端服务器,由所述云端服务器根据所述粗粒度测试报告对所述测试视频进行精细度分析。由此,可以采用端云结合对测试视频进行分级分析,从而准确地获得测试结果。
-
公开(公告)号:CN115952255B
公开(公告)日:2023-12-05
申请号:CN202211457156.3
申请日:2022-11-21
Applicant: 北京邮电大学
IPC: G06F16/33 , G06F16/35 , G06F40/289 , G06F16/683 , G06F16/783 , G06F18/22 , G06F18/241 , G06F18/2415 , G06N3/0464 , G06N3/047 , G06N3/08
Abstract: 本申请公开了一种多模态信号内容分析方法、装置、电子设备及存储介质。该多模态信号内容分析方法包括:获取音频‑视频信号对应的字幕词嵌入特征;利用预训练的字幕代理特征提取模型处理所述字幕词嵌入特征,得到字幕代理特征;基于所述字幕代理特征生成字幕。本申请实施例提供的多模态信号内容分析方法,利用预训练的字幕代理特征提取模型处理所述字幕词嵌入特征,得到字幕代理特征,基于字幕代理特征生成字幕,避免了由于字幕语义差异性对训练的影响,生成的字幕能够更好地描述音频‑视频信号的内容,克服了相关技术中没有考虑字幕差异
-
公开(公告)号:CN117115497A
公开(公告)日:2023-11-24
申请号:CN202310076588.8
申请日:2023-01-16
Applicant: 北京邮电大学
IPC: G06V10/764 , G06V10/774 , G06N20/00
Abstract: 本公开提供了一种类别分类方法、装置、介质及设备,所述方法包括:定义在线类别挖掘数据结构;构构建分类模型,其中,所述分类模型包括:用于特征提取的编码器 和用于将提取到的特征投影到有判别力的表征空间的投影器 基于所述数据结构中用于训练的数据对所述分类模型进行训练;基于所述数据结构中用于测试的数据对训练后的分类模型进行分类测试。本公开的方法与现有技术相比,实现了不依赖辅助信息,面向开放数据,实例级即使预测的未见类别挖掘。在6个常用的分类数据集上验证了本公开所提方法的优越性。
-
公开(公告)号:CN116091867A
公开(公告)日:2023-05-09
申请号:CN202310063908.6
申请日:2023-01-12
Applicant: 北京邮电大学
IPC: G06V10/774 , G06V10/764
Abstract: 本申请提供了一种模型训练、图像识别方法、装置、设备及存储介质,所述方法包括:在源域数据集中随机获取多个图像插曲;构建任务感知的自适应学习网络模型;将所述图像插曲输入所述自适应学习网络模型,得到所述图像插曲中的支持样本与查询样本的特征图;根据所述支持样本与所述查询样本的特征图确定分类损失,根据所述图像插曲与目标域数据集的域偏移确定自适应损失,根据所述分类损失与所述自适应损失确定整体损失;根据所述整体损失调整所述自适应学习网络模型,直至所述整体损失收敛为止。本申请中,通过将域偏移引入损失函数,从而使得训练后的模型可以兼顾具备不同域偏移的目标数据集,达到更准确的图像识别效果。
-
公开(公告)号:CN115439845B
公开(公告)日:2023-05-02
申请号:CN202210922254.3
申请日:2022-08-02
Applicant: 北京邮电大学
Abstract: 本申请涉及一种基于图神经网络的图像外推方法、装置、存储介质及终端。其中,所述方法包括:获取图像外推的原始图像;根据所述原始图像和目标检测器,确定所述图像外推的无向场景图;根据所述无向场景图和图神经网络,推测所述图像外推的外推场景图;根据所述外推场景图、所述原始图像和生成对抗网络,生成所述图像外推的外推图像。本申请能够根据原始图像生成外推图像,且生成的外推图像更具真实性。
-
公开(公告)号:CN115345165A
公开(公告)日:2022-11-15
申请号:CN202210990180.7
申请日:2022-08-18
Applicant: 北京邮电大学
IPC: G06F40/295 , G06K9/62 , G06N3/04
Abstract: 本发明公开了一种面向标签稀缺或分布不平衡场景的特定实体识别方法,提出了伪标签分布感知的自适应重采样策略和去混淆的边际损失函数,对训练集中标签数据分布的容忍度高,解决了域内标签稀缺场景下实体类别分布不平衡问题,显著改善实体识别模型在标签稀缺或分布不平衡的困难场景下的泛化性能,明显提高稀有类别的精确率、召回率和F1值等评价指标,适用于训练集中标签样本较少或不平衡度较高的特定实体识别任务。
-
公开(公告)号:CN115222940A
公开(公告)日:2022-10-21
申请号:CN202210795660.8
申请日:2022-07-07
Applicant: 北京邮电大学
IPC: G06V10/26 , G06V10/82 , G06V10/764 , G06N3/04 , G06N3/08
Abstract: 本申请实施例公开了一种语义分割方法和系统,所述方法包括:将源域图片转化为拟真域图片;将所述源域图片及其真实标注、所述拟真域图片输入第一中间级熵对齐网络,输出拟真域预测结果;将所述源域图片及其真实标注、所述目标域图片输入第二中间级熵对齐网络,输出目标域预测结果;利用所述拟真域预测结果和源域图片的真实标注训练输出级预测修正网络;将所述目标域预测结果输入所述输出级预测修正网络进行掩码修正,得到修正后的掩码结果。降低源域和目标域间的域隙,达到更好的域迁移目的。
-
公开(公告)号:CN111860672B
公开(公告)日:2021-03-16
申请号:CN202010738474.1
申请日:2020-07-28
Applicant: 北京邮电大学
Abstract: 一种基于分块卷积神经网络的细粒度图像分类方法,涉及细粒度图像识别技术领域,解决现有方法将原始图像平均分块后输入到卷积神经网络中用于细粒度图像分类,存在感受野限制较弱的问题,本发明不引入额外的参数与运算,在预测过程中保留通用卷积神经网络的高效性,不需要过大的感受野的特性将输入特征图进行分块,每块分别进行卷积操作后,再重新拼接,具有较强的限制性。本发明将卷积的感受野按需要进行限制,使网络更加关注局部区域的特征,更适合应用于细粒度图像分类任务。本发明所述的细粒度图像分类方法,在不引入更多参数的前提下,限制卷积层的感受野范围,使卷积神经网络能够寻找较小的有判别力的局部区域。
-
公开(公告)号:CN112200093A
公开(公告)日:2021-01-08
申请号:CN202011091366.6
申请日:2020-10-13
Applicant: 北京邮电大学
Abstract: 本发明涉及一种基于不确定性估计的行人再识别方法,属于行人再识别技术领域,包括步骤:获取待识别的原始图像序列,原始图像序列中的每一帧原始图像均包含同一行人;将原始图像序列输入至利用基于不确定性估计的行人再识别模型训练方法训练得到的行人再识别模型中,计算输出集合;使用不确定性估计集合对输出集合进行排序,选择不确定性估计最高的Δ个输出的标号,获得标号集合和选定输出集合;将选定输出集合中的所有输出与数据库中的样本计算距离,并分别匹配出距离最小的图像作为行人再识别的检索结果。本发明能够同时抑制输入图像中的区域噪声和随机噪声,降低噪声对于行人再识别模型性能的影响,提高模型的稳定性,提升行人再识别的准确率。
-
-
-
-
-
-
-
-
-