-
公开(公告)号:CN114187482A
公开(公告)日:2022-03-15
申请号:CN202111068580.4
申请日:2021-09-13
Applicant: 罗伯特·博世有限公司
Inventor: M·诺鲁齐
IPC: G06V10/774 , G06V10/762 , G06K9/62 , G06T5/50 , G06N3/08
Abstract: 用于生成合成图像的级联聚类生成器网络。用于训练聚类网络和生成器网络的组合的方法包括:·提供训练输入图像的集合;·由聚类网络将训练输入图像映射到指示训练输入图像属于的聚类的表示;·从随机分布抽取噪声样本以及从由聚类网络标识的聚类的集合抽取目标聚类的指示;·由生成器网络将目标聚类的指示和噪声样本映射到伪图像,并将每个伪图像与用于产生它的目标聚类的指示组合,以形成伪对;·从训练输入图像的集合中抽取真图像;·将每个真图像与聚类网络分配给它的聚类的指示组合以形成真对;·将真对和伪对的混合馈送到鉴别器网络;·优化表征鉴别器网络的行为的参数;以及·优化表征聚类网络的行为的参数和表征生成器网络的行为的参数。
-
公开(公告)号:CN115690462A
公开(公告)日:2023-02-03
申请号:CN202210876366.X
申请日:2022-07-25
Applicant: 罗伯特·博世有限公司
IPC: G06V10/74 , G06V10/764 , G06V10/774 , G06V20/58
Abstract: 用于训练编码器的方法,该编码器将测量数据的数据样本映射为可由机器评估的表示,具有步骤:提供训练样本的集合,其中在预给定应用的上下文中定义说明两个样本x1和x2以何种程度彼此相似的关系;提供用可训练参数参数化的函数,其将样本映射为表示;提供相似性度量,其向样本x1和x2分配表示fθ(x1)和fθ(x2)的相似性和/或表示fθ(x1)和fθ(x2)的处理产品的相似性;从训练样本x的集合X中抽取至少一个查询样本;对于查询样本,从集合X中确定与查询样本q相似的正样本p的以优先顺序排列的集合P,及从集合X中确定不再与查询样本q相似的负样本n的集合N;至少对参数θ优化,目标是对应于正样本p∈P的优先顺序对相似性度量h(q,p)排序,且对于所有n∈N相似性度量h(q,p)都大于h(q,n)。
-
公开(公告)号:CN117011751A
公开(公告)日:2023-11-07
申请号:CN202310505540.4
申请日:2023-05-05
Applicant: 罗伯特·博世有限公司
Abstract: 本发明涉及将视频帧的帧序列转换为场景的场景序列的方法,具有:从帧序列的每个视频帧中提取特征;将属于每个视频帧的特征转换为第一工作空间中特征表示,帧序列中相应视频帧的位置被编码到特征表示中;用变换器网络的可训练编码器确定每个特征表示分别与所有其他特征表示的特征交互,特征交互表征帧预测;将属于每个已确定场景的类别转换为第二工作空间中场景表示,场景序列中相应场景的位置被编码到场景表示中;用变换器网络的可训练解码器确定场景表示分别与所有其他场景表示的场景交互;用解码器确定每个场景交互与每个特征交互的场景特征交互;用解码器从场景特征交互中至少确定场景序列中对帧序列和已确定场景而言最合理的下一场景的类别。
-
公开(公告)号:CN115620027A
公开(公告)日:2023-01-17
申请号:CN202210820296.6
申请日:2022-07-13
Applicant: 罗伯特·博世有限公司
IPC: G06V10/74 , G06V10/774
Abstract: 将视频图像的预给定时间序列x编码为由静态特征和非静态特征组成的机器可评估的表示的方法,其包括步骤:提供用可训练参数θ参数化的至少一个函数,该函数将视频图像序列x̃映射为表示;从视频图像序列x中选择N个彼此邻接的不重叠的短片段和一个包含所有N个短片段的长片段;用参数化的函数确定长片段的表示和针对i=1,…,N的短片段的多个表示;用预给定的成本函数如下地评价参数化的函数:长片段的表示鉴于至少一个预给定一致性条件在多大程度上与短片段的表示一致;以如下目标优化函数的参数θ:对未来确定的表示和的成本函数的评价预计有所改善;用通过完成优化的参数参数化的函数将视频图像的预给定时间序列x映射为所求的表示。
-
公开(公告)号:CN112529000A
公开(公告)日:2021-03-19
申请号:CN202010985564.0
申请日:2020-09-18
Applicant: 罗伯特·博世有限公司
Inventor: M·诺鲁齐
Abstract: 公开了一种用于训练分割模型的设备和方法,其中,训练分割模型的方法包括:分割模型(204)为数字图像(106)生成分割图像(206),该分割图像(206)包括描述数字图像(106)中的至少一个对象(202)的片段(208);根据分割图像(206)的片段(208)来确定数字图像(106)的可预测性(212);训练分割模型(204),以减少根据分割图像(206)的片段(208)的数字图像(106)的可预测性(212)。
-
-
-
-