一种基于加权列抽样XGBoost的图像目标分类方法

    公开(公告)号:CN107392241B

    公开(公告)日:2020-12-25

    申请号:CN201710580163.5

    申请日:2017-07-17

    Abstract: 本发明实施例提出了一种基于加权列抽样XGBoost的图像目标分类方法,包括:利用在大型数据集ILSVRC预训练过的并且在PASCAL VOC 2012数据集上进行过微调的卷积神经网络提取目标图像特征;连接多层学习到的特征以获得更多决定其图像类别的内容信息;利用基于加权列抽样的XGBoost方法对图像特征分类,根据属性重要度,在构建决策树之前对属性进行次采样,将抽取的具有更多信息的属性用于当前决策树的构建,重复迭代直到收敛,得到性能最佳的图像分类模型。根据本发明实施例提供的技术方案,当数据的属性维度大且冗余度高时,该方法可以扩展到其他使用列抽样的分类方法,提高图像目标分类的平均准确率。

    一种基于元路径引导嵌入的查询推荐方法及装置

    公开(公告)号:CN110083766A

    公开(公告)日:2019-08-02

    申请号:CN201910342766.0

    申请日:2019-04-26

    Abstract: 本发明实施例提供了一种基于元路径引导嵌入的查询推荐方法及装置,其中方法包括:获取目标物品信息;提取包含目标物品名称的短语;将短语拆分为多个词语;在预设的统一词语嵌入词典中查找不同词语组合后形成的短语所对应的短语嵌入;将将查找到的词语嵌入组合为短语嵌入,并将短语嵌入按照不同预设元路径进行逐阶聚合,得到不同的用户嵌入及查询嵌入;基于不同的用户嵌入,查询嵌入,以及用户原始静态特征,计算用户与不同查询的交互概率;将具有最大交互概率的查询推荐给用户。本发明实施例能够基于用户、物品、以及查询之间的交互按照不同的预设元路径进行逐阶聚合,使所推荐的查询更有可能符合用户的需求,从而提高推荐查询准确性。

    一种基于元路径引导嵌入的查询推荐方法及装置

    公开(公告)号:CN110083766B

    公开(公告)日:2021-05-14

    申请号:CN201910342766.0

    申请日:2019-04-26

    Abstract: 本发明实施例提供了一种基于元路径引导嵌入的查询推荐方法及装置,其中方法包括:获取目标物品信息;提取包含目标物品名称的短语;将短语拆分为多个词语;在预设的统一词语嵌入词典中查找不同词语组合后形成的短语所对应的短语嵌入;将将查找到的词语嵌入组合为短语嵌入,并将短语嵌入按照不同预设元路径进行逐阶聚合,得到不同的用户嵌入及查询嵌入;基于不同的用户嵌入,查询嵌入,以及用户原始静态特征,计算用户与不同查询的交互概率;将具有最大交互概率的查询推荐给用户。本发明实施例能够基于用户、物品、以及查询之间的交互按照不同的预设元路径进行逐阶聚合,使所推荐的查询更有可能符合用户的需求,从而提高推荐查询准确性。

    一种数据选择偏差下的去相关聚类方法及装置

    公开(公告)号:CN111814853A

    公开(公告)日:2020-10-23

    申请号:CN202010591742.1

    申请日:2020-06-24

    Inventor: 王啸 石川 范少华

    Abstract: 本发明实施例提供了一种数据选择偏差下的去相关聚类方法及装置,其中,方法包括:获取存在偏差的多张图像,作为样本集;基于样本集,联合优化加权后聚类算法和去相关正则项,得到最优加权后聚类算法,其中,最优加权后聚类算法是通过多次计算加权后聚类算法得到的,加权后聚类算法是通过使用去相关正则项学习得到的各样本权重,对聚类算法进行加权得到的;各样本权重为通过使用去相关正则项,对样本集中的各图像,学习本次各样本权重;通过在本次加权后聚类算法中包含的本次聚类中心和簇不是首次聚类中心和簇,并且本次聚类中心和簇与上次聚类中心和簇之间的差异小于阈值时,得到最优加权后聚类算法,以确定图像不受偏差影响的聚类中心和簇。

    一种数据选择偏差下的去相关聚类方法及装置

    公开(公告)号:CN111814853B

    公开(公告)日:2023-03-21

    申请号:CN202010591742.1

    申请日:2020-06-24

    Inventor: 王啸 石川 范少华

    Abstract: 本发明实施例提供了一种数据选择偏差下的去相关聚类方法及装置,其中,方法包括:获取存在偏差的多张图像,作为样本集;基于样本集,联合优化加权后聚类算法和去相关正则项,得到最优加权后聚类算法,其中,最优加权后聚类算法是通过多次计算加权后聚类算法得到的,加权后聚类算法是通过使用去相关正则项学习得到的各样本权重,对聚类算法进行加权得到的;各样本权重为通过使用去相关正则项,对样本集中的各图像,学习本次各样本权重;通过在本次加权后聚类算法中包含的本次聚类中心和簇不是首次聚类中心和簇,并且本次聚类中心和簇与上次聚类中心和簇之间的差异小于阈值时,得到最优加权后聚类算法,以确定图像不受偏差影响的聚类中心和簇。

    一种去偏差图神经网络的训练方法、装置和电子设备

    公开(公告)号:CN114139593A

    公开(公告)日:2022-03-04

    申请号:CN202111050184.9

    申请日:2021-09-08

    Inventor: 石川 王啸 范少华

    Abstract: 本发明实施例提供了一种去偏差图神经网络的训练方法、装置和电子设备,方法包括:将样本图数据及其对应的样本标签索引输入待训练去偏差图神经网络;基于样本图数据和样本标签索引提取需要去相关的特征变量;基于所述特征变量确定样本图数据对应的样本权重;基于特征变量和样本权重确定第一损失函数,并基于第一损失函数判断待训练去偏差图神经网络是否收敛;若收敛,确定待训练去偏差图神经网络为目标去偏差图神经网络;若未收敛,反复迭代直至收敛。该方法训练的目标去偏差图神经网络可以减小训练节点的偏差,提高了去偏差图神经网络泛化到测试节点上的效果。

    一种基于加权列抽样XGBoost的图像目标分类方法

    公开(公告)号:CN107392241A

    公开(公告)日:2017-11-24

    申请号:CN201710580163.5

    申请日:2017-07-17

    Abstract: 本发明实施例提出了一种基于加权列抽样XGBoost的图像目标分类方法,包括:利用在大型数据集ILSVRC预训练过的并且在PASCAL VOC 2012数据集上进行过微调的卷积神经网络提取目标图像特征;连接多层学习到的特征以获得更多决定其图像类别的内容信息;利用基于加权列抽样的XGBoost方法对图像特征分类,根据属性重要度,在构建决策树之前对属性进行次采样,将抽取的具有更多信息的属性用于当前决策树的构建,重复迭代直到收敛,得到性能最佳的图像分类模型。根据本发明实施例提供的技术方案,当数据的属性维度大且冗余度高时,该方法可以扩展到其他使用列抽样的分类方法,提高图像目标分类的平均准确率。

Patent Agency Ranking