自动地生成训练数据
    1.
    发明公开

    公开(公告)号:CN102289459A

    公开(公告)日:2011-12-21

    申请号:CN201110178954.8

    申请日:2011-06-20

    Applicant: 微软公司

    CPC classification number: G06F17/30864

    Abstract: 本发明揭示了自动生成训练数据的技术。计算机可读介质、计算机系统,以及计算设备促进生成二进制分类器和实体提取器训练数据。选择种子URL,并标识种子URL内的URL模式。标识数据结构中的匹配URL,并将对应的查询以及它们的相关联的权重添加到从其中选择训练数据的潜在的训练数据集中。

    用于学习高效级联检测器的多实例修剪

    公开(公告)号:CN101743537B

    公开(公告)日:2013-01-23

    申请号:CN200880024082.6

    申请日:2008-07-01

    Applicant: 微软公司

    Inventor: C·张 P·沃拉

    CPC classification number: G06K9/6256 G06K9/00288 G06K9/6282

    Abstract: “分类器训练器”训练用于检测信号中的特定对象(例如,图像中的脸、语音中的词语、信号中的模式等)的组合分类器。在一个实施例中,引入“多实例修剪”(MIP)来训练组合分类器的弱分类器或“特征”。具体地,将已训练的组合分类器和用于设置虚假肯定/否定操作点的相关联的最终阈值与所学习的中间拒绝阈值相组合以构造组合分类器。拒绝阈值是使用确保原始组合分类器检测到的对象也被该组合分类器检测到的修剪过程来学习的,从而保证在修剪之后对训练集合相同的检测率。贯穿训练所需的唯一参数是最终级联系统的目标检测率。在附加实施例中,组合分类器使用权重修整、自引导和被称为“肥树桩”分类器的弱分类器的各种组合来训练。

    用于学习高效级联检测器的多实例修剪

    公开(公告)号:CN101743537A

    公开(公告)日:2010-06-16

    申请号:CN200880024082.6

    申请日:2008-07-01

    Applicant: 微软公司

    Inventor: C·张 P·沃拉

    CPC classification number: G06K9/6256 G06K9/00288 G06K9/6282

    Abstract: “分类器训练器”训练用于检测信号中的特定对象(例如,图像中的脸、语音中的词语、信号中的模式等)的组合分类器。在一个实施例中,引入“多实例修剪”(MIP)来训练组合分类器的弱分类器或“特征”。具体地,将已训练的组合分类器和用于设置虚假肯定/否定操作点的相关联的最终阈值与所学习的中间拒绝阈值相组合以构造组合分类器。拒绝阈值是使用确保原始组合分类器检测到的对象也被该组合分类器检测到的修剪过程来学习的,从而保证在修剪之后对训练集合相同的检测率。贯穿训练所需的唯一参数是最终级联系统的目标检测率。在附加实施例中,组合分类器使用权重修整、自引导和被称为“肥树桩”分类器的弱分类器的各种组合来训练。

Patent Agency Ranking