一种业务执行方法、装置、存储介质及电子设备

    公开(公告)号:CN119202185A

    公开(公告)日:2024-12-27

    申请号:CN202411322542.0

    申请日:2024-09-20

    Abstract: 本说明书公开了一种业务执行方法、装置、存储介质及电子设备。在此方法中,获取至少一个提示示例以及待分析文本,并确定待分析文本对应的自解释指令,将至少一个提示示例、待分析文本以及自解释指令输入到预设的大语言模型中,以使大语言模型根据至少一个提示示例所包含的待分析示例文本与待分析示例文本对应的标准回复文本,来预测待分析文本对应的初始回复文本,并通过待分析文本对应的自解释指令,生成得到初始回复文本的原因信息,以根据原因信息,调整初始回复文本,并将调整后的初始回复文本作为待分析文本对应的目标回复文本,继而,根据待分析文本对应的目标回复文本,执行业务。

    一种针对大语言模型的样本重排序方法及装置

    公开(公告)号:CN119337888A

    公开(公告)日:2025-01-21

    申请号:CN202411426918.2

    申请日:2024-10-12

    Abstract: 本说明书实施例提供了一种针对大语言模型的样本重排序方法,包括针对范例样本集的多轮迭代处理,范例样本集中各范例样本具有在目标语义下的语义标签,其中任意一轮迭代处理包括:从本轮的当前范例样本集中获取任意范例样本,将其作为输入文本,与本轮的当前序列共同输入大语言模型,使得大语言模型将当前序列中的文本作为范例,推断得到输入文本的若干推断标签的概率。根据若干推断标签的概率,确定范例样本对应的第一指标。对当前范例样本集中的各个范例样本,基于各自的第一指标进行排序,得到第一序列。从第一序列中选取目标范例样本,将其从当前范例样本集移动到当前序列尾部。

    一种数据处理方法、装置及设备
    4.
    发明公开

    公开(公告)号:CN119202184A

    公开(公告)日:2024-12-27

    申请号:CN202411322485.6

    申请日:2024-09-20

    Abstract: 本说明书实施例公开了一种数据处理方法、装置及设备,该方法应用于开放域问答系统,所述开放域问答系统中包括检索器和阅读器,该方法包括:接收用户输入的目标问题数据;基于目标问题数据的内容,对目标问题数据对应的用户意图进行扩展处理,得到一个或多个不同的澄清查询数据;分别将每个澄清查询数据输入到检索器中,得到每个澄清查询数据对应的检索数据;确定每个澄清查询数据对应的检索数据与目标问题数据之间的相关性信息,并基于确定的相关性信息对每个澄清查询数据对应的检索数据进行重写处理,得到重写的检索数据;基于重写的检索数据,通过阅读器确定目标问题数据对应的答案数据,并输出该答案数据。

    一种信息抽取方法、装置、存储介质及电子设备

    公开(公告)号:CN119128129A

    公开(公告)日:2024-12-13

    申请号:CN202411311820.2

    申请日:2024-09-19

    Abstract: 本说明书公开了一种信息抽取方法、装置、存储介质和电子设备,获取待抽取文本,并确定若干个目标抽取类别。针对每个目标抽取类别,根据预设对应关系,确定该目标抽取类别对应的标识符,作为提示信息。将提示信息及待抽取文本输入的信息抽取模型,得到信息抽取模型输出的待抽取文本的抽取结果,该信息抽取模型是通过预设对应关系确定出的标识符训练得到的。由于需要抽取的抽取类别较多,导致提示信息的长度过长,因此,本方法通过将抽取类别转换为标识符,以减少提示信息的长度。此外,信息抽取模型也是通过标识符训练得到的,因此,将标识符作为提示信息输入信息抽取模型,可在待抽取文本中抽取与标识符对应的抽取类别的信息。

    一种模型的处理方法及装置
    6.
    发明公开

    公开(公告)号:CN119204163A

    公开(公告)日:2024-12-27

    申请号:CN202411322454.0

    申请日:2024-09-20

    Abstract: 本说明书一个或多个实施例公开了一种模型的处理方法及装置,该方法首先确定预训练语言模型,并在预训练语言模型的初始权重矩阵旁路上设置低秩适配矩阵,得到第一预训练语言模型,然后获取当前业务场景下多个历史任务信息、每个历史任务信息对应的用于表示用户请求的历史请求数据、以及每个历史请求数据对应的历史响应标签,最后以历史任务信息和每个历史任务信息对应的历史请求数据为输入数据,基于输入数据对应的第一预训练语言模型的输出结果和每个历史请求数据对应的历史响应标签,保持第一预训练语言模型的预训练权重不变,通过预设的损失函数对低秩适配矩阵对应的增量权重进行训练,得到训练后的目标大语言模型。

    一种标签生成的方法、装置及电子设备

    公开(公告)号:CN119128272A

    公开(公告)日:2024-12-13

    申请号:CN202411337666.6

    申请日:2024-09-24

    Abstract: 本说明书实施例公开了一种标签生成的方法、装置及电子设备。所述标签生成的方法包括:接收用户输入的针对目标对象的标签生成指令;获取与所述目标对象匹配的层次标签体系,所述层次标签体系为根据预设的标签集构建的具有层次结构的标签体系,所述标签集中标签存放于所述层次标签体系中至少一个终止节点;基于大型语言模型,从所述层次标签体系的根节点出发,根据所述目标对象的描述信息和所述层次标签体系中各个中间节点的生成标签,逐层次确定与所述目标对象相关的中间节点;在所述层次标签体系中,将与所述目标对象相关的中间节点相连的终止节点,确定为目标终止节点,并从所述目标终止节点存放的标签中,确定所述目标对象的标签。

    基于大语言模型的多智能体系统优化方法及装置

    公开(公告)号:CN118709716A

    公开(公告)日:2024-09-27

    申请号:CN202410708243.4

    申请日:2024-06-03

    Abstract: 本发明公开一种基于大语言模型的多智能体系统优化方法及装置,属于自然语言处理技术领域。所述方便包括:基于目标任务选取协作架构和智能体所使用的大型语言模型;确定智能体数量、最大协作轮次以及提前停止阈值,并结合协作架构和智能体所使用的大型语言模型,构建多智能体系统以及获取该多智能体系统的参数规模;结合多智能体系统的参数规模,将协作架构的优化分解为在任何单个时间步长智能体之间每条协作路径的相对重要性和回报,以对多智能体系统进行优化。本发明可以更有效地分析和优化基于LLM的多智能体系统。

    基于多方面反事实数据的文档筛选方法、装置及介质

    公开(公告)号:CN118445664A

    公开(公告)日:2024-08-06

    申请号:CN202410521200.5

    申请日:2024-04-28

    Abstract: 本发明公开了基于多方面反事实数据的文档筛选方法、装置及介质,属于自然语言处理技术领域。本发明对带有内容质量分数标签的原文档进行内容质量的反事实推理,得到反事实文档,由原文档和反事实文档构成反事实文档对,得到对比文档集;基于大语言模型构建大语言模型评估器,利用对比文档集对该大语言模型评估器进行联合训练;针对待筛选文档,利用训练好的大语言模型评估器评估其内容质量分数,根据评估结果进行文档筛选。本发明能够对待筛选文档的内容质量进行准确评估,根据评估结果来筛选文档,从而筛选出质量优秀的文档。

    一种基于可控生成的结构化记录抽取方法和装置

    公开(公告)号:CN113609244B

    公开(公告)日:2023-09-05

    申请号:CN202110637453.5

    申请日:2021-06-08

    Abstract: 本发明提出一种基于可控生成的结构化记录抽取方法和装置。该方法可以从非结构化的文本中自动抽取结构化的文本记录,其抽取步骤包括:对于目标文本,序列到结构网络首先利用基于自注意力机制的编码器捕捉目标文本的文本语义,然后利用基于混合注意力机制的解码器生成结构化表示;其中,基于前缀树的可控解码算法在生成的过程中对解码空间进行约束,注入框架知识,引导模型解码,生成线性表达式;最后,对线性表达式进行结构转化,生成结构化记录。在模型训练阶段,采用两阶段的模型学习方法帮助模型进行高效的学习:第一阶段采用子结构进行模型学习,注重文本块抽取能力的训练;第二阶段采用完整记录结构进行模型学习,注重结构抽取能力的训练。

Patent Agency Ranking