文本向量表征模型的训练和文本聚类

    公开(公告)号:CN113553858B

    公开(公告)日:2023-10-10

    申请号:CN202110862902.6

    申请日:2021-07-29

    Inventor: 尚航 吕廷迅

    Abstract: 本公开关于一种文本向量表征模型的训练方法和装置及文本聚类方法和装置。所述训练方法包括:获取文本样本;将文本样本转换为第一文本输入矩阵和经过掩码处理后的第二文本输入矩阵;将第一文本输入矩阵输入至所述文本向量表征模型,以获取第一文本向量表征;将第二文本输入矩阵输入至辅助文本向量表征模型,以获取第二文本向量表征;根据第一文本向量表征与第二文本向量表征之间的相似度损失值来更新所述文本向量表征模型的参数,以对所述文本向量表征模型进行训练。

    对象类别的识别方法和装置及服务器

    公开(公告)号:CN112733969A

    公开(公告)日:2021-04-30

    申请号:CN202110344172.0

    申请日:2021-03-31

    Abstract: 本公开关于一种对象类别的识别方法和装置及服务器。其中,该方法包括:获取待检索图像;识别待检索图像,得到待检索图像的目标特征向量;从聚类中心集合中获取与目标特征向量之间的距离最近的目标聚类中心,其中,聚类中心集合包括:至少一个对象类别,以及每个对象类别对应的多个聚类中心;获取目标聚类中心对应的对象类别,作为待检索图像的分类识别结果。本公开实施例通过聚类的方式构建聚类中心集合,并通过获取最近距离的目标聚类中心,得到分类识别结果,无需建立全部图像的数据结构,达到降低新增数据或新增分类的开销,提升对象类别的识别方法扩展性的效果,进而解决了相关技术中通过构建检索索引图实现图像匹配的方法扩展性较差的问题。

Patent Agency Ranking