-
公开(公告)号:CN113196296B
公开(公告)日:2024-09-27
申请号:CN201980082636.6
申请日:2019-12-10
Applicant: 微软技术许可有限责任公司
IPC: G06V10/764 , G06V10/25 , G06V10/82 , G06N3/0464 , G06V40/10 , G06V40/20
Abstract: 计算系统被配置为训练对象分类器。接收针对场景的单目图像数据以及地面真值数据。确定几何上下文,该几何上下文包括相对于固定平面的三维相机位置。在所述图像数据内标识感兴趣区域(RoI)以及潜在遮挡物集合。针对每个潜在遮挡物,遮挡区被投影到三维中的所述固定平面。针对每个遮挡区,生成在所述固定平面上的遮挡的RoI集合。每个遮挡的RoI被投影回到二维中的所述图像数据。分类器通过以下操作而被训练:最小化损失函数,该损失函数通过将与所述RoI和遮挡的RoI有关的信息输入分类器而生成;以及基于所述地面真值数据,最小化所述集合中的每个RoI和每个遮挡的RoI在所述固定平面上的位置误差。然后,将经训练的分类器输出以用于对象检测。
-
公开(公告)号:CN115699102A
公开(公告)日:2023-02-03
申请号:CN202180038305.X
申请日:2021-04-21
Applicant: 微软技术许可有限责任公司
IPC: G06V20/40 , G06V10/25 , G06V10/774 , G06T7/20
Abstract: 本文的公开使得能够跟踪实时视频流中的多个对象。针对从视频流接收的每个个体帧,该帧的帧类型被确定。基于个体帧是对象检测帧类型,对象提议集在个体帧中被检测,对象提议集和对象轨迹集之间的关联被分配,并且该对象轨迹集的状态基于所分配的关联被更新。基于个体帧是对象跟踪帧类型,基于对象轨迹集中的每个对象轨迹对该帧执行单对象跟踪,并且该对象轨迹集基于所执行的单对象跟踪被更新。针对接收到的每个帧,实时对象位置数据流基于对象轨迹集被提供。
-
公开(公告)号:CN113196296A
公开(公告)日:2021-07-30
申请号:CN201980082636.6
申请日:2019-12-10
Applicant: 微软技术许可有限责任公司
Abstract: 计算系统被配置为训练对象分类器。接收针对场景的单目图像数据以及地面真值数据。确定几何上下文,该几何上下文包括相对于固定平面的三维相机位置。在所述图像数据内标识感兴趣区域(RoI)以及潜在遮挡物集合。针对每个潜在遮挡物,遮挡区被投影到三维中的所述固定平面。针对每个遮挡区,生成在所述固定平面上的遮挡的RoI集合。每个遮挡的RoI被投影回到二维中的所述图像数据。分类器通过以下操作而被训练:最小化损失函数,该损失函数通过将与所述RoI和遮挡的RoI有关的信息输入分类器而生成;以及基于所述地面真值数据,最小化所述集合中的每个RoI和每个遮挡的RoI在所述固定平面上的位置误差。然后,将经训练的分类器输出以用于对象检测。
-
公开(公告)号:CN110192236A
公开(公告)日:2019-08-30
申请号:CN201880007374.2
申请日:2018-01-12
Applicant: 微软技术许可有限责任公司
Abstract: 在关于行动者的物理条件的发生时自动训练该行动者。在检测到行动者具有物理条件(例如正在参与或即将参与物理活动)时,系统确定将为该活动提供训练。在确定训练将被提供后,系统自动分派训练。例如,系统可能会使人类或机器人被分派给行动者,以向行动者示出如何执行该活动。备选地或代替地,可以将信号片段的表示分派给行动者。向行动者提供训练的表示可以包括与行动者目前通过该活动确定目标的工作目标类似的工作目标。该表示还可以包括先前适当地参与活动的人的表示。
-
公开(公告)号:CN119027742A
公开(公告)日:2024-11-26
申请号:CN202411250545.8
申请日:2019-12-10
Applicant: 微软技术许可有限责任公司
IPC: G06V10/764 , G06V10/25 , G06V10/82 , G06N3/0464 , G06V40/10 , G06V40/20
Abstract: 本公开的实施例涉及使用几何上下文检测人群中的对象。该用于执行对象检测的方法包括:接收针对场景的图像数据;生成所述图像数据内的感兴趣区域集合;标识所述感兴趣区域集合内的一个或多个潜在遮挡物的集合;将每个感兴趣区域和针对每个潜在遮挡物的多个被遮挡的感兴趣区域中的每个被遮挡的感兴趣区域分类为作为感兴趣对象的可能性;以及输出针对每个感兴趣区域和每个被遮挡的感兴趣区域的分类。
-
-
-
-