-
公开(公告)号:CN119337888A
公开(公告)日:2025-01-21
申请号:CN202411426918.2
申请日:2024-10-12
Applicant: 中国科学院软件研究所 , 支付宝(杭州)信息技术有限公司
IPC: G06F40/30 , G06N5/04 , G06F16/353
Abstract: 本说明书实施例提供了一种针对大语言模型的样本重排序方法,包括针对范例样本集的多轮迭代处理,范例样本集中各范例样本具有在目标语义下的语义标签,其中任意一轮迭代处理包括:从本轮的当前范例样本集中获取任意范例样本,将其作为输入文本,与本轮的当前序列共同输入大语言模型,使得大语言模型将当前序列中的文本作为范例,推断得到输入文本的若干推断标签的概率。根据若干推断标签的概率,确定范例样本对应的第一指标。对当前范例样本集中的各个范例样本,基于各自的第一指标进行排序,得到第一序列。从第一序列中选取目标范例样本,将其从当前范例样本集移动到当前序列尾部。
-
公开(公告)号:CN119202185A
公开(公告)日:2024-12-27
申请号:CN202411322542.0
申请日:2024-09-20
Applicant: 中国科学院软件研究所 , 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06N5/045
Abstract: 本说明书公开了一种业务执行方法、装置、存储介质及电子设备。在此方法中,获取至少一个提示示例以及待分析文本,并确定待分析文本对应的自解释指令,将至少一个提示示例、待分析文本以及自解释指令输入到预设的大语言模型中,以使大语言模型根据至少一个提示示例所包含的待分析示例文本与待分析示例文本对应的标准回复文本,来预测待分析文本对应的初始回复文本,并通过待分析文本对应的自解释指令,生成得到初始回复文本的原因信息,以根据原因信息,调整初始回复文本,并将调整后的初始回复文本作为待分析文本对应的目标回复文本,继而,根据待分析文本对应的目标回复文本,执行业务。
-
公开(公告)号:CN119128129A
公开(公告)日:2024-12-13
申请号:CN202411311820.2
申请日:2024-09-19
Applicant: 中国科学院软件研究所 , 支付宝(杭州)信息技术有限公司
IPC: G06F16/335 , G06F40/126 , G06F40/279 , G06F18/214
Abstract: 本说明书公开了一种信息抽取方法、装置、存储介质和电子设备,获取待抽取文本,并确定若干个目标抽取类别。针对每个目标抽取类别,根据预设对应关系,确定该目标抽取类别对应的标识符,作为提示信息。将提示信息及待抽取文本输入的信息抽取模型,得到信息抽取模型输出的待抽取文本的抽取结果,该信息抽取模型是通过预设对应关系确定出的标识符训练得到的。由于需要抽取的抽取类别较多,导致提示信息的长度过长,因此,本方法通过将抽取类别转换为标识符,以减少提示信息的长度。此外,信息抽取模型也是通过标识符训练得到的,因此,将标识符作为提示信息输入信息抽取模型,可在待抽取文本中抽取与标识符对应的抽取类别的信息。
-
-