-
公开(公告)号:CN116844011A
公开(公告)日:2023-10-03
申请号:CN202310823910.9
申请日:2023-07-06
Applicant: 河北工业大学 , 北京市新技术应用研究所有限公司
IPC: G06V10/80 , G06V10/74 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/08 , G06F40/284 , G06F40/211
Abstract: 本公开提供了一种图像描述文本的生成方法,包括:对目标图像的网格特征进行处理,构建关于目标图像的多个伪区域特征,其中伪区域特征用于表征目标图像的局部视觉信息;分别对网格特征和伪区域特征进行编码增强处理,获得融合有多层图像编码结果的网格增强特征和融合有多层局部编码结果的伪区域增强特征;以及对网格增强特征和伪区域增强特征进行语义解析,生成用于表征目标图像中视觉信息的图像描述文本。本公开还提供了一种图像描述文本的生成装置、电子设备及存储介质。
-
公开(公告)号:CN114882521A
公开(公告)日:2022-08-09
申请号:CN202210333714.9
申请日:2022-03-30
Applicant: 河北工业大学 , 北京市新技术应用研究所有限公司
IPC: G06V40/10 , G06V10/42 , G06V10/44 , G06V10/46 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本公开提供一种基于多分支网络的无监督行人重识别训练方法,包括:源域训练和目标域训练,在源域训练阶段,将带有标签的图像输入至预训练模型进行训练,获得训练好的预训练模型;在目标域训练阶段,将无标签的图像输入至目标域训练模型中,经训练,获得行人重识别模型。本公开还提供了一种基于多分支网络的无监督行人重识别训练装置,以及一种基于多分支网络的无监督行人重识别方法、装置、电子设备以及可读存储介质。
-
公开(公告)号:CN114332517A
公开(公告)日:2022-04-12
申请号:CN202111506192.X
申请日:2021-12-10
Applicant: 河北工业大学 , 北京市新技术应用研究所有限公司
IPC: G06V10/762 , G06V10/774 , G06V40/10 , G06K9/62
Abstract: 本公开提供了一种无监督行人重识别模型的建立方法,包括:使用图像样本数据集在源域上进行训练,获得源域模型;在目标域创建协作网络与联合网络,将源域模型的模型参数迁移至目标域,对协作网络及联合网络进行初始化;将图像样本数据集分别输入至第一临时平均模型和第二临时平均模型,获得两组图像样本,分别提取样本特征,获取两组图像样本的样本特征的平均样本特征;对图像样本数据集进行聚类处理,获得聚类中心和伪标签;对图像样本数据集进行图像样本数据集分割处理,分割为信赖集和噪声集;对联合网络以及协作网络进行交替训练,获得训练后的无监督行人重识别模型。本公开还提供了一种无监督行人重识别方法、电子设备及可读存储介质。
-
-