-
公开(公告)号:CN118839005A
公开(公告)日:2024-10-25
申请号:CN202411074787.6
申请日:2024-08-06
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/36 , G06F40/194 , G06F40/30 , G06N5/022 , G06N5/04
Abstract: 本说明书实施例提供了一种基于向量数据库进行问答推理的方法及装置。所述向量数据库中存储有从知识图谱采样的多个子图对应的多个子图向量,各子图向量通过对子图以及对应的图描述文本进行编码得到。该方法包括:获取目标问答对,目标问答对中包含目标问题与第一候选答案。在知识图谱中,确定与目标问题相关的若干相关三元组。生成增强查询文本,其中包含目标问答对的问答文本与若干相关三元组对应的描述文本。将增强查询文本输入文本编码器进行编码,得到增强查询向量。基于增强查询向量,从向量数据库中召回若干相似子图向量。根据若干相似子图向量与增强查询向量,确定目标评分,该目标评分反映第一候选答案对于目标问题的合理度。
-
公开(公告)号:CN118917401A
公开(公告)日:2024-11-08
申请号:CN202411081997.8
申请日:2024-08-06
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种基于知识图谱训练图编码器的方法及装置。所述知识图谱包括以三元组形式记录的多个节点及其之间的连接边。所述方法包括:根据预设搜索策略,从所述知识图谱中采样节点和连接边,得到若干子图。将第一子图输入所述图编码器,得到第一子图所对应的图表征。基于第二子图中各个三元组所具有的文本语料,确定第一描述文本。将所述第一描述文本输入文本编码器,得到对应的文本表征。基于所述图表征与文本表征之间的表征差异,确定由第一子图和第一描述文本构成的第一样本对的对比损失。根据多个样本对各自的对比损失,更新所述图编码器。
-