-
公开(公告)号:CN119621950A
公开(公告)日:2025-03-14
申请号:CN202311159877.0
申请日:2023-09-08
Applicant: 华为云计算技术有限公司
IPC: G06F16/335 , G06F16/334 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本申请公开了人工智能领域中的一种基于语义向量进行信息检索的模型的训练方法及装置。该方法包括:获取第一训练数据集和第二训练数据集;其中,第一训练数据为第一训练数据集中任一条训练数据,该第一训练数据由第一查询文本、其对应的具有正向标签的第一检索文本以及其对应的具有负向标签的第二检索文本组成;第二训练数据为第二训练数据集中任一条训练数据,该第二训练数据由第二查询文本、其对应的第三检索文本、以及该第二查询文本和第三检索文本之间的相关程度的标注组成;基于第一训练数据集更新第一信息检索模型得到第二信息检索模型;基于第二训练数据集更新第二信息检索模型得到第三信息检索模型。本申请有利于提升信息检索模型的性能。