一种信息抽取方法、装置、存储介质及电子设备

    公开(公告)号:CN119128129A

    公开(公告)日:2024-12-13

    申请号:CN202411311820.2

    申请日:2024-09-19

    Abstract: 本说明书公开了一种信息抽取方法、装置、存储介质和电子设备,获取待抽取文本,并确定若干个目标抽取类别。针对每个目标抽取类别,根据预设对应关系,确定该目标抽取类别对应的标识符,作为提示信息。将提示信息及待抽取文本输入的信息抽取模型,得到信息抽取模型输出的待抽取文本的抽取结果,该信息抽取模型是通过预设对应关系确定出的标识符训练得到的。由于需要抽取的抽取类别较多,导致提示信息的长度过长,因此,本方法通过将抽取类别转换为标识符,以减少提示信息的长度。此外,信息抽取模型也是通过标识符训练得到的,因此,将标识符作为提示信息输入信息抽取模型,可在待抽取文本中抽取与标识符对应的抽取类别的信息。

    一种标签生成的方法、装置及电子设备

    公开(公告)号:CN119128272A

    公开(公告)日:2024-12-13

    申请号:CN202411337666.6

    申请日:2024-09-24

    Abstract: 本说明书实施例公开了一种标签生成的方法、装置及电子设备。所述标签生成的方法包括:接收用户输入的针对目标对象的标签生成指令;获取与所述目标对象匹配的层次标签体系,所述层次标签体系为根据预设的标签集构建的具有层次结构的标签体系,所述标签集中标签存放于所述层次标签体系中至少一个终止节点;基于大型语言模型,从所述层次标签体系的根节点出发,根据所述目标对象的描述信息和所述层次标签体系中各个中间节点的生成标签,逐层次确定与所述目标对象相关的中间节点;在所述层次标签体系中,将与所述目标对象相关的中间节点相连的终止节点,确定为目标终止节点,并从所述目标终止节点存放的标签中,确定所述目标对象的标签。

    一种业务执行方法、装置、存储介质及电子设备

    公开(公告)号:CN119202185A

    公开(公告)日:2024-12-27

    申请号:CN202411322542.0

    申请日:2024-09-20

    Abstract: 本说明书公开了一种业务执行方法、装置、存储介质及电子设备。在此方法中,获取至少一个提示示例以及待分析文本,并确定待分析文本对应的自解释指令,将至少一个提示示例、待分析文本以及自解释指令输入到预设的大语言模型中,以使大语言模型根据至少一个提示示例所包含的待分析示例文本与待分析示例文本对应的标准回复文本,来预测待分析文本对应的初始回复文本,并通过待分析文本对应的自解释指令,生成得到初始回复文本的原因信息,以根据原因信息,调整初始回复文本,并将调整后的初始回复文本作为待分析文本对应的目标回复文本,继而,根据待分析文本对应的目标回复文本,执行业务。

    一种模型的处理方法及装置
    4.
    发明公开

    公开(公告)号:CN119204163A

    公开(公告)日:2024-12-27

    申请号:CN202411322454.0

    申请日:2024-09-20

    Abstract: 本说明书一个或多个实施例公开了一种模型的处理方法及装置,该方法首先确定预训练语言模型,并在预训练语言模型的初始权重矩阵旁路上设置低秩适配矩阵,得到第一预训练语言模型,然后获取当前业务场景下多个历史任务信息、每个历史任务信息对应的用于表示用户请求的历史请求数据、以及每个历史请求数据对应的历史响应标签,最后以历史任务信息和每个历史任务信息对应的历史请求数据为输入数据,基于输入数据对应的第一预训练语言模型的输出结果和每个历史请求数据对应的历史响应标签,保持第一预训练语言模型的预训练权重不变,通过预设的损失函数对低秩适配矩阵对应的增量权重进行训练,得到训练后的目标大语言模型。

    一种针对大语言模型的样本重排序方法及装置

    公开(公告)号:CN119337888A

    公开(公告)日:2025-01-21

    申请号:CN202411426918.2

    申请日:2024-10-12

    Abstract: 本说明书实施例提供了一种针对大语言模型的样本重排序方法,包括针对范例样本集的多轮迭代处理,范例样本集中各范例样本具有在目标语义下的语义标签,其中任意一轮迭代处理包括:从本轮的当前范例样本集中获取任意范例样本,将其作为输入文本,与本轮的当前序列共同输入大语言模型,使得大语言模型将当前序列中的文本作为范例,推断得到输入文本的若干推断标签的概率。根据若干推断标签的概率,确定范例样本对应的第一指标。对当前范例样本集中的各个范例样本,基于各自的第一指标进行排序,得到第一序列。从第一序列中选取目标范例样本,将其从当前范例样本集移动到当前序列尾部。

    一种数据处理方法、装置及设备
    7.
    发明公开

    公开(公告)号:CN119202184A

    公开(公告)日:2024-12-27

    申请号:CN202411322485.6

    申请日:2024-09-20

    Abstract: 本说明书实施例公开了一种数据处理方法、装置及设备,该方法应用于开放域问答系统,所述开放域问答系统中包括检索器和阅读器,该方法包括:接收用户输入的目标问题数据;基于目标问题数据的内容,对目标问题数据对应的用户意图进行扩展处理,得到一个或多个不同的澄清查询数据;分别将每个澄清查询数据输入到检索器中,得到每个澄清查询数据对应的检索数据;确定每个澄清查询数据对应的检索数据与目标问题数据之间的相关性信息,并基于确定的相关性信息对每个澄清查询数据对应的检索数据进行重写处理,得到重写的检索数据;基于重写的检索数据,通过阅读器确定目标问题数据对应的答案数据,并输出该答案数据。

    一种针对文本数据的风险防控方法、装置及设备

    公开(公告)号:CN118606478A

    公开(公告)日:2024-09-06

    申请号:CN202410853536.1

    申请日:2024-06-27

    Abstract: 本说明书实施例公开了一种针对文本数据的风险防控方法、装置及设备,该方法包括:获取用户执行目标业务的过程中的文本数据;将所述文本数据输入到预先训练的风险防控模型中,得到所述文本数据对应的风险识别结果和通过所述风险防控模型得到所述风险识别结果的推理思维链路信息,所述风险防控模型是使用文本训练数据并通过大模型构造推理思维链样本及进行风险分类的多任务训练而得到的模型;基于所述风险识别结果和/或所述推理思维链路信息,对所述用户执行目标业务进行风险防控处理。

    基于用户隐私保护的应用程序检测方法及装置

    公开(公告)号:CN111680287B

    公开(公告)日:2020-11-13

    申请号:CN202010819239.7

    申请日:2020-08-14

    Abstract: 本说明书实施例提供一种基于用户隐私保护的应用程序检测方法及装置,该方法从待检测的目标应用程序中,提取出存在用户隐私数据获取需求的若干场景对应的用户界面和隐私数据列表,然后提取第一用户界面的内容数据,将内容数据转换为相应的第一特征向量;计算第一特征向量与第一参考特征向量之间的第一相似度,当第一相似度超过第一预定阈值时,获取第一参考特征向量对应的参考场景下的参考隐私数据列表;计算第一隐私数据列表与参考隐私数据列表之间的第二相似度;至少基于第二相似度,判别第一场景是否为异常场景。该方法能够有效检测出隐私数据不合理的场景,进而防止用户隐私数据被不必要地获取。

    一种风险提示方法、装置及电子设备

    公开(公告)号:CN111553696A

    公开(公告)日:2020-08-18

    申请号:CN202010328350.6

    申请日:2020-04-23

    Inventor: 周书恒 祝慧佳

    Abstract: 本说明书公开了一种风险提示方法、装置及电子设备,该风险提示方法包括:获得用户对目标商品的操作行为所属的行为类型以及提供目标商品的目标商家;基于目标商家售卖的所有商品的类目信息,获得目标商家的商品类目分散度;基于用户的行为类型和目标商家的商品类目分散度,对用户的操作行为进行风险提示。通过商家的商品类目分散度、用户行为类型,综合考虑商家侧和用户侧的信息,来确定是否需要对用户进行风险提示,提高风险提示的准确性。

Patent Agency Ranking