自动地生成训练数据
    2.
    发明公开

    公开(公告)号:CN102289459A

    公开(公告)日:2011-12-21

    申请号:CN201110178954.8

    申请日:2011-06-20

    Applicant: 微软公司

    CPC classification number: G06F17/30864

    Abstract: 本发明揭示了自动生成训练数据的技术。计算机可读介质、计算机系统,以及计算设备促进生成二进制分类器和实体提取器训练数据。选择种子URL,并标识种子URL内的URL模式。标识数据结构中的匹配URL,并将对应的查询以及它们的相关联的权重添加到从其中选择训练数据的潜在的训练数据集中。

Patent Agency Ranking