-
公开(公告)号:CN113553858B
公开(公告)日:2023-10-10
申请号:CN202110862902.6
申请日:2021-07-29
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种文本向量表征模型的训练方法和装置及文本聚类方法和装置。所述训练方法包括:获取文本样本;将文本样本转换为第一文本输入矩阵和经过掩码处理后的第二文本输入矩阵;将第一文本输入矩阵输入至所述文本向量表征模型,以获取第一文本向量表征;将第二文本输入矩阵输入至辅助文本向量表征模型,以获取第二文本向量表征;根据第一文本向量表征与第二文本向量表征之间的相似度损失值来更新所述文本向量表征模型的参数,以对所述文本向量表征模型进行训练。
-
公开(公告)号:CN113657411A
公开(公告)日:2021-11-16
申请号:CN202110970481.9
申请日:2021-08-23
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本申请提供一种神经网络模型的训练方法、图像特征提取方法及相关装置,用于解决相关技术中自监督学习对硬件要求高且训练速度低的问题。在本申请实施例提供的对比学习方法中,提出了困难负样本对的概念,通过构建正样本对和困难负样本对,能够使得神经网络模型学习到正样本之间的特征,而且能够准确的区分差别较小的负样本。由此,保证了对困难负样本的学习,即保证了对差别较大的负样本的学习,使得神经网络模型能够准确的提取图像特征。
-
公开(公告)号:CN112733969A
公开(公告)日:2021-04-30
申请号:CN202110344172.0
申请日:2021-03-31
Applicant: 北京达佳互联信息技术有限公司
IPC: G06K9/62
Abstract: 本公开关于一种对象类别的识别方法和装置及服务器。其中,该方法包括:获取待检索图像;识别待检索图像,得到待检索图像的目标特征向量;从聚类中心集合中获取与目标特征向量之间的距离最近的目标聚类中心,其中,聚类中心集合包括:至少一个对象类别,以及每个对象类别对应的多个聚类中心;获取目标聚类中心对应的对象类别,作为待检索图像的分类识别结果。本公开实施例通过聚类的方式构建聚类中心集合,并通过获取最近距离的目标聚类中心,得到分类识别结果,无需建立全部图像的数据结构,达到降低新增数据或新增分类的开销,提升对象类别的识别方法扩展性的效果,进而解决了相关技术中通过构建检索索引图实现图像匹配的方法扩展性较差的问题。
-
-