哈希编码方法和装置
    171.
    发明授权

    公开(公告)号:CN105320685B

    公开(公告)日:2019-03-19

    申请号:CN201410364922.0

    申请日:2014-07-29

    Inventor: 刘汝杰 刘曦

    Abstract: 本发明实施例提供一种哈希编码方法和装置,其中,所述方法包括:首先利用多个投影对数据投影得到多维数据投影值,然后在每维数据下通过k‑means聚类得到k个聚类中心,假定两两相邻聚类中心存在一个阈值,根据熵最大化原则求得(k‑1)个阈值并利用这些阈值及预设的编码方案对每维数据进行编码,最后拼合所有投影下的编码得到最终的二值编码。通过在每个投影方向下使用多个阈值,克服了单阈值量化中无法有效对数据划分问题且可以选择使用任意多个阈值;通过使用多个自适应学习的阈值来对每维数据进行量化,有效地保持了近邻结构,从而为大规模数据索引及近邻查询提供良好基础。

    多视角向量处理方法和设备

    公开(公告)号:CN108875463A

    公开(公告)日:2018-11-23

    申请号:CN201710343390.6

    申请日:2017-05-16

    Abstract: 本申请公开了一种多视角向量处理方法和设备。其中,所述多视角向量x用于表征包含至少两个不可分立的视角的信息的对象,该方法包括:建模步骤,建立该多视角向量的模型,使得其至少包含以下分量:所述多视角向量的总体均值μ;所述多视角向量的每一个视角的分量;以及噪声∈;以及训练步骤,利用所述多视角向量x的训练数据获得所述总体均值μ、每一个视角的分量的参数和所述噪声∈的参数。该设备包括处理器和存储有程序代码的存储介质,所述程序代码当被处理器执行时,实现如前所述的方法。

    训练面部检测模型的方法和装置以及面部检测方法和装置

    公开(公告)号:CN108280388A

    公开(公告)日:2018-07-13

    申请号:CN201710010709.3

    申请日:2017-01-06

    Inventor: 贾晓飞 刘汝杰

    Abstract: 公开了一种训练面部检测模型的方法和装置以及面部检测方法和装置,其中训练面部检测模型的方法包括:训练至少两个区域识别模型,所述至少两个区域识别模型中的每个区域识别模型与面部的一个不同部位相关联,用于识别输入图像中可能属于与该区域识别模型相关联的部位的区域。根据本公开的实施例,能够快速并精确地进行面部检测。

    基于稀疏神经网络的语音识别方法、语音识别装置和电子设备

    公开(公告)号:CN107808664A

    公开(公告)日:2018-03-16

    申请号:CN201610773161.3

    申请日:2016-08-30

    CPC classification number: G10L15/16 G10L15/02 G10L15/063

    Abstract: 本申请实施例提供一种基于稀疏神经网络的语音识别方法、装置和电子设备,该方法包括:对待识别语音片段进行处理,以获得所述待识别语音片段中的每个语音帧的特征向量;采用稀疏神经网络对所述特征向量进行识别,以获得与所述特征向量对应的状态标签值(state id),其中,所述稀疏神经网络的权重矩阵基于维度变换而得到;以及采用解码模型对所述状态标签值进行解码,以得到所述待识别语音片段对应的文本。根据本实施例,语音识别用的稀疏神经网络的规模被缩小,并且,该稀疏神经网络的训练时间较短,训练结果被改善。

    几何重建对象的方法和设备

    公开(公告)号:CN107680074A

    公开(公告)日:2018-02-09

    申请号:CN201610625552.0

    申请日:2016-08-02

    CPC classification number: G06T7/00 G06T17/00

    Abstract: 本发明公开了一种几何重建对象的方法和设备。该方法包括:根据深度图和对应的颜色图,估计相机姿态;基于所估计的相机姿态,根据深度图,获得三维空间中体素的截断有向距离函数TSDF值;以及根据所获得的TSDF值,几何重建所述对象;其中,通过解最优化问题来根据深度图和对应的颜色图,估计相机姿态;其中,在所述最优化问题中,代价函数与下列因素有关:通过所要估计的相机姿态调整后的当前帧的相机坐标空间中的三维点与前面所有帧的全局坐标空间中的对应三维点的距离的平方和、以及通过所要估计的相机姿态调整后的前面所有帧的全局坐标空间中的三维点在当前帧对应颜色图上的颜色与前面所有帧的全局坐标空间中的对应颜色的距离度量的平方和。

    关键词列表形成装置及方法以及电子设备

    公开(公告)号:CN103902600B

    公开(公告)日:2017-12-01

    申请号:CN201210581696.2

    申请日:2012-12-27

    Abstract: 本公开提供一种关键词列表形成装置和方法以及电子设备。该关键词列表形成装置包括:初始关键词形成单元,针对每个多音字,计算多音字的上下文词语对于多音字的区分度,以将区分度高于第一预定阈值的上下文词语作为初始关键词;关键词划分单元,根据初始关键词与该多音字的位置关系,将其划分为多个关键词组;和冗余关键词去除单元,针对包括至少两个初始关键词的每个关键词组,基于关键词组中的初始关键词共同出现的次数以及每个初始关键词的区分度来确定并删除冗余的初始关键词,从而形成关键词列表。本公开可获得如下效果之一:提高在以关键词确定多音字发音时的计算速度;降低多音字确定时的出错概率;提高语音合成处理的效率。

    说话人识别方法和说话人识别设备

    公开(公告)号:CN107274904A

    公开(公告)日:2017-10-20

    申请号:CN201610216660.2

    申请日:2016-04-07

    Abstract: 本发明公开了一种说话人识别方法和说话人识别设备。该说话人识别方法包括:从待识别说话人语料中,提取待识别说话人的语音特征;基于所提取的待识别说话人的语音特征、体现语音特征在特征空间中的分布的通用背景模型UBM、体现语音特征在特征空间中的分布的变化的统计值的梯度通用说话人模型GUSM、体现环境变化的总变化矩阵,得到待识别说话人模型;以及比较待识别说话人模型和已知说话人模型,以确定待识别说话人是否为已知说话人之一。

    多模态特征的融合方法以及装置

    公开(公告)号:CN104239360B

    公开(公告)日:2017-10-17

    申请号:CN201310252672.7

    申请日:2013-06-24

    Inventor: 刘曦 刘汝杰

    Abstract: 本发明实施例提供一种多模态特征的融合方法以及装置,所述融合方法包括:利用训练图像以及图像的多模态特征,为查询图像生成多组关于多个类的第一分类分数,并获得所述第一分类分数对应的多个两两关系矩阵;融合所述多个两两关系矩阵以得到组合后的关系矩阵;根据组合后的关系矩阵计算最终的关于所述多个类的分类分数,并为所述查询图像选择具有较大分类分数的一个或多个类。通过本发明实施例,不但可以有效且快速地进行多模态特征融合,而且可以很好地处理训练数据噪声或者数据缺失的情况。

    图像标注方法和图像标注装置

    公开(公告)号:CN103365850B

    公开(公告)日:2017-07-14

    申请号:CN201210084554.5

    申请日:2012-03-27

    Abstract: 本发明公开了一种图像标注方法和图像标注装置。根据本发明的图像标注方法,包括:对于给定图像集合中的每一个图像,在所述图像集合中选择在图像特征上与所述图像相近的多个其它图像;通过用所述多个其它图像的图像特征拟合所述图像的图像特征,获得所述图像的多个拟合系数;以及根据所述图像的所述多个拟合系数,利用所述多个其它图像的标签来构造所述图像的标签。

    用于检测图像中的云的装置、方法以及电子设备

    公开(公告)号:CN103679684B

    公开(公告)日:2017-05-24

    申请号:CN201210333163.2

    申请日:2012-09-10

    Abstract: 本发明提供了用于检测图像中的云的装置、方法以及电子设备,以克服传统的云检测方法所存在的检测效果差的问题。上述用于检测图像中的云的装置包括:计算模块,其被配置用于根据图像中的每个基本处理单元的预定大小邻域内的像素信息,计算每个基本处理单元的白化程度;以及确定模块,其被配置用于将白化程度在预定范围内的基本处理单元确定为云。上述用于检测图像中的云的方法用于执行能够实现上述用于检测图像中的云的装置的功能的处理。上述电子设备包括上述用于检测图像中的云的装置。本发明的上述技术能够应用于图像处理领域。

Patent Agency Ranking