使用否定数据优化多类别多媒体数据分类

    公开(公告)号:CN107209861B

    公开(公告)日:2021-12-31

    申请号:CN201680006455.1

    申请日:2016-01-15

    Abstract: 描述了用于通过利用否定多媒体数据项训练和更新分类器来优化多类别图像分类的技术。该技术描述了访问多个多媒体数据项中的肯定多媒体数据项,从肯定多媒体数据项中提取特征,以及至少部分基于特征来训练分类器。分类器可以包括多个模型向量,每个模型向量对应于个体标签之一。系统可以使用肯定多媒体数据和否定多媒体数据迭代地测试分类器,并且可以取决于多媒体数据项是肯定的还是否定的来有区别地更新与分类器相关联的一个或多个模型向量。还描述了用于应用分类器以至少部分基于将相似度值与从分类器训练得到的相应统计值相比较来确定新的多媒体数据项是否与主题相关联的技术。

    对象敏感的图像搜索
    2.
    发明授权

    公开(公告)号:CN102541999B

    公开(公告)日:2015-09-02

    申请号:CN201110391645.9

    申请日:2011-11-15

    Inventor: 汪萌 华先胜 宋彦

    CPC classification number: G06F17/30256 G06K9/6259 G06N99/005

    Abstract: 本文描述了用于对象敏感的图像搜索的方法和系统。这些方法和系统可用于接收对于对象图像的查询并基于图像的排序来向用户提供查询结果的经排序的列表。对象敏感的图像搜索可生成从来自在网站处共享图像的用户的自由训练数据中训练的预先训练的多实例学习(MIL)模型来标识对象的常见图案,和/或可生成从查询结果的伪正面和伪负面样本中“在进行中”训练的MIL模型来标识对象的常见图案。由此,向用户呈现包括在结果顶端附近突出地显示对象的图像的查询结果。

    通过内容检测、搜索和信息聚集来丰富在线视频

    公开(公告)号:CN102884538B

    公开(公告)日:2016-11-16

    申请号:CN201180020853.6

    申请日:2011-04-04

    Abstract: 许多因特网用户通过在线视频消费内容。例如,用户可观看电影、电视剧、音乐视频、和/或家庭自制视频。向消费在线视频的用户提供附加信息可能是有利的。遗憾的是,许多现有技术不能提供来自外部源的、与在线视频有关的附加信息。相应的,本文描述了用于确定与在线视频相关的一组附加信息的一个或多个系统和/或技术。具体来说,视觉的、文本的、音频、和/或其它特征可从在线视频中提取出来(例如,在线视频的原始内容和/或嵌入的广告)。使用提取出的特征,可基于将提取出的特征与数据库的内容进行匹配来确定附加信息(例如,图像、广告等)。附加信息可被呈现给消费在线视频的用户。

    根据大规模非结构化数据学习多媒体语义

    公开(公告)号:CN106462807A

    公开(公告)日:2017-02-22

    申请号:CN201580021255.9

    申请日:2015-04-24

    CPC classification number: G06F17/30705 G06F17/30675 G06F17/30864 G06N99/005

    Abstract: 本文中描述了用于根据非结构化数据来学习话题模型并应用所学习的话题模型来识别针对新数据项的语义的系统和方法。在至少一个实施例中,与标签的集合相关联的多媒体数据项的语料库可以被处理以生成与标签的集合相关联的经提炼的多媒体数据项的语料库。这样的处理可以包括基于所提取的多媒体特征的相似度来将多媒体数据项布置在簇中并生成簇内特征和簇间特征。簇内特征和簇间特征可以用于将多媒体数据项从语料库移除以生成经提炼的语料库。经提炼的语料库可以被用于训练用于识别标签的话题模型。得到的模型可以被存储并在随后被用于识别由用户输入的多媒体数据项的语义。

    根据大规模非结构化数据学习多媒体语义

    公开(公告)号:CN106462807B

    公开(公告)日:2019-02-22

    申请号:CN201580021255.9

    申请日:2015-04-24

    Abstract: 本文中描述了用于根据非结构化数据来学习话题模型并应用所学习的话题模型来识别针对新数据项的语义的系统和方法。在至少一个实施例中,与标签的集合相关联的多媒体数据项的语料库可以被处理以生成与标签的集合相关联的经提炼的多媒体数据项的语料库。这样的处理可以包括基于所提取的多媒体特征的相似度来将多媒体数据项布置在簇中并生成簇内特征和簇间特征。簇内特征和簇间特征可以用于将多媒体数据项从语料库移除以生成经提炼的语料库。经提炼的语料库可以被用于训练用于识别标签的话题模型。得到的模型可以被存储并在随后被用于识别由用户输入的多媒体数据项的语义。

    基于区域的图像操纵
    6.
    发明授权

    公开(公告)号:CN102521849B

    公开(公告)日:2015-08-26

    申请号:CN201110321232.3

    申请日:2011-10-12

    Inventor: 王井东 华先胜

    CPC classification number: G06T11/001

    Abstract: 基于区域的图像操纵可包括选择和分割特定图像的区域。通过使用各区域的像素上的简化笔画来标识这些区域。可相应地操纵或变换所标识的区域。某些实现包括使用其他图像或对象来填充区域,并且包括执行文本查询来搜索这些图像或对象。

    用于处理弱监督图像的方法、系统和计算机存储介质

    公开(公告)号:CN107209860B

    公开(公告)日:2021-07-16

    申请号:CN201580073396.5

    申请日:2015-12-28

    Abstract: 描述了通过利用从弱监督图像提取的基于分块的特征训练分类器来优化多类图像分类。可以接收与一组标签相关联的图像的语料库。可以从语料库中的个体图像中提取一个或多个分块。可以从一个或多个分块中提取基于分块的特征,并且可以从一个或多个分块的个体分块中提取分块表示。至少部分地基于基于分块的特征分块可以被布置到聚类中。可以至少部分地基于表示个体分块之间的相似性的所确定的相似性值,从个体聚类中移除个体分块中的至少一些。系统可以部分地基于从改进聚类中的分块中提取的基于分块的特征来训练分类器。分类器可用于准确和高效地分类新图像。

    使用否定数据优化多类别多媒体数据分类

    公开(公告)号:CN107209861A

    公开(公告)日:2017-09-26

    申请号:CN201680006455.1

    申请日:2016-01-15

    CPC classification number: G06K9/66 G06K9/6218 G06K9/6269 G06K9/6284 G06N99/005

    Abstract: 描述了用于通过利用否定多媒体数据项训练和更新分类器来优化多类别图像分类的技术。该技术描述了访问多个多媒体数据项中的肯定多媒体数据项,从肯定多媒体数据项中提取特征,以及至少部分基于特征来训练分类器。分类器可以包括多个模型向量,每个模型向量对应于个体标签之一。系统可以使用肯定多媒体数据和否定多媒体数据迭代地测试分类器,并且可以取决于多媒体数据项是肯定的还是否定的来有区别地更新与分类器相关联的一个或多个模型向量。还描述了用于应用分类器以至少部分基于将相似度值与从分类器训练得到的相应统计值相比较来确定新的多媒体数据项是否与主题相关联的技术。

    使用分块特征来优化多类图像分类

    公开(公告)号:CN107209860A

    公开(公告)日:2017-09-26

    申请号:CN201580073396.5

    申请日:2015-12-28

    CPC classification number: G06K9/6227 G06K9/6218 G06K9/623 G06K9/6262

    Abstract: 描述了通过利用从弱监督图像提取的基于分块的特征训练分类器来优化多类图像分类。可以接收与一组标签相关联的图像的语料库。可以从语料库中的个体图像中提取一个或多个分块。可以从一个或多个分块中提取基于分块的特征,并且可以从一个或多个分块的个体分块中提取分块表示。至少部分地基于基于分块的特征分块可以被布置到聚类中。可以至少部分地基于表示个体分块之间的相似性的所确定的相似性值,从个体聚类中移除个体分块中的至少一些。系统可以部分地基于从改进聚类中的分块中提取的基于分块的特征来训练分类器。分类器可用于准确和高效地分类新图像。

Patent Agency Ranking