对话方法、模型训练方法及设备
    1.
    发明公开

    公开(公告)号:CN118689972A

    公开(公告)日:2024-09-24

    申请号:CN202410693299.7

    申请日:2024-05-30

    Inventor: 王昊文

    Abstract: 本说明书实施例提供的对话方法、模型训练方法及设备,其中,对话模型包括多Agent网络以及基模型,多Agent网络包括具有预设交互顺序的多个Agent,每个Agent用于处理对话模型的多个子任务中的一个子任务,基于输入相关信息以及从领域知识库查询的领域信息,按照预设交互顺序通过Agent调用基模型执行对应的子任务。

    多任务大模型训练方法及装置
    2.
    发明公开

    公开(公告)号:CN118278498A

    公开(公告)日:2024-07-02

    申请号:CN202410423830.9

    申请日:2024-04-09

    Inventor: 王昊文 孙涛

    Abstract: 本说明书实施例涉及多任务大模型训练方法及装置,所述方法包括对所述大模型的旁路任务网络进行微调,所述旁路任务网络包括S个适配器,任务路由网络以及适配器路由网络;所述微调包括:首先,利用所述任务路由网络,确定输入的第一文本归属于各个任务类型的第一权重;接下来,利用所述适配器路由网络,确定各个任务类型关于各个适配器的第二权重;然后,根据所述第一权重和第二权重,组合所述S个适配器分别处理所述第一文本的处理结果,得到所述旁路任务网络的旁路输出,所述旁路输出用于得到预测结果,所述预测结果用于更新所述旁路任务网络。

    问题的答复方法、模型训练方法、设备、存储介质及产品

    公开(公告)号:CN120031130A

    公开(公告)日:2025-05-23

    申请号:CN202510112851.3

    申请日:2025-01-23

    Inventor: 王昊文

    Abstract: 本说明书一个或多个实施例提供一种问题的答复方法、模型训练方法、设备、存储介质及产品。问题的答复方法包括:将包含多轮对话内容的问题嵌入预设提示模板,得到目标提示,将目标提示输入任务拆解模型中,以由任务拆解模型按照目标提示中的至少两种任务类型对问题进行任务拆解,得到由已训练完成的任务执行模型执行的任务集合;将任务集合输入任务执行模型中,以由任务执行模型按照任务集合中的各个任务的任务类型执行各个任务,得到问题的答复;至少两种任务类型包括总结型和推理型,总结型任务由任务执行模型执行一次,推理型任务由任务执行模型执行至少两次得到至少两个推理结论、并综合至少两个推理结论确定本任务的输出内容。

    基于因果知识的业务处理方法、装置以及设备

    公开(公告)号:CN115081631A

    公开(公告)日:2022-09-20

    申请号:CN202210752826.8

    申请日:2022-06-29

    Abstract: 本说明书实施例公开了基于因果知识的业务处理方法、装置以及设备。方案包括:确定业务对象相关的多个特征;根据所述业务对象的待预测指标,确定各所述特征的因果知识,所述因果知识反映了对应的特征与所述待预测指标之间的因果关系;根据所述因果知识,生成包含了用于表示各所述特征的节点的因果图;根据所述多个特征的值和所述因果图,生成所述节点的嵌入向量;根据所述嵌入向量,对所述业务对象的所述待预测指标的值进行预测;根据所述预测的结果进行相应的业务处理。

    基于深层目标优化的模型训练方法、信息推荐方法和装置

    公开(公告)号:CN117112899A

    公开(公告)日:2023-11-24

    申请号:CN202311078942.7

    申请日:2023-08-24

    Inventor: 王昊文 杜宇亮

    Abstract: 本说明书的实施例提供了一种基于深层目标优化的模型训练方法、信息推荐方法和装置。在该基于深层目标优化的模型训练方法中,模型训练过程所使用的每个训练样本包括特征数据和与直接训练目标和基于此的深层训练目标相匹配的标签数据,特征数据包括用户特征、物品特征和历史交互特征;根据特征数据,得到各个训练目标之间的条件概率值和与各个训练目标对应的目标预测值以及对应的条件预测值;进而确定各个训练样本对应的深层‑直接目标因果强度值,进而确定各个训练样本对应的深层目标预测值;再根据各个当前训练样本的深层目标预测值和对应的标签数据之间的差异,确定损失值;根据损失值调整当前预测模型的模型参数,直到满足训练结束条件。

    内容项的推荐方法、装置、设备以及存储介质

    公开(公告)号:CN116756411A

    公开(公告)日:2023-09-15

    申请号:CN202310536824.X

    申请日:2023-05-10

    Inventor: 王昊文 杜宇亮

    Abstract: 本说明书公开了一种内容项的推荐方法、装置、设备以及存储介质,方法包括:获取多个内容项的初始内容项特征集合,所述多个内容项包括未推荐过的内容项和已推荐过的内容项,所述初始内容项特征集合包括各个所述内容项的初始内容项特征,所述已推荐过的内容项的初始内容项特征包括交互行为特征;基于所述初始内容项特征集合,确定所述多个内容项的邻域信息,所述邻域信息用于表示所述多个内容项之间的关联关系;基于所述多个内容项的初始内容项特征集合和所述邻域信息,对所述多个内容项进行重编码,得到所述多个内容项的目标内容项特征集合,所述目标内容项特征集合包括各个所述内容项的目标内容项特征,所述目标内容项特征用于进行内容项推荐。

    一种基于医疗规则库的LLM模型推理方法及相关设备

    公开(公告)号:CN119443262A

    公开(公告)日:2025-02-14

    申请号:CN202411444825.2

    申请日:2024-10-15

    Inventor: 王昊文 杜宇亮

    Abstract: 本说明书提供了一种基于医疗规则库的LLM模型推理方法及相关设备。该规则库包含用于辅助LLM模型执行推理任务的多条推理规则,推理规则为由多个字段构成的结构化数据;其中,多个字段包括用于描述推理条件的若干条件字段,以及用于描述与推理条件匹配的推理目标的目标字段;条件字段中包含作为推理条件的实体。该方法包括:获取用户输入的目标对话文本,并提取目标对话文本中包含的文本实体;在规则库包含的多条推理规则中,查找出与文本实体相关的至少一条目标推理规则;基于至少一条目标推理规则构建提示词,并将提示词输入至LLM模型中,由LLM模型基于提示词执行与推理任务相关的逻辑推理,以生成与目标对话文本对应的应答文本。

    一种针对LLM模型的微调方法及相关设备

    公开(公告)号:CN119416856A

    公开(公告)日:2025-02-11

    申请号:CN202411544989.2

    申请日:2024-10-31

    Inventor: 王昊文

    Abstract: 本说明书提供了一种针对LLM模型的微调方法及相关设备。针对LLM模型的微调包含依次进行的多个微调阶段,所述多个微调阶段中包括基于强化学习的微调阶段。该方法包括:获取微调数据集,所述微调数据集中包含与所述多个微调阶段对应的多种格式的第一微调数据;基于预设的目标格式,对所述多种格式的第一微调数据分别进行格式转换处理,得到与所述第一微调数据对应的目标格式的第二微调数据;其中,所述目标格式为与所述基于强化学习的微调阶段对应的第一微调数据的格式;基于所述目标格式的第二微调数据,对预训练完成的所述LLM模型进一步执行微调训练。

    多模态多任务医疗大模型训练方法及装置

    公开(公告)号:CN118097686B

    公开(公告)日:2024-08-16

    申请号:CN202410515946.5

    申请日:2024-04-25

    Inventor: 王昊文

    Abstract: 本说明书实施例涉及多模态多任务医疗大模型训练方法及装置,所述方法包括对所述大模型的旁路任务网络进行微调,所述旁路任务网络包括S个适配器、跨模态任务路由网络以及适配器路由网络;所述微调包括:首先,获取第一文本和第一图像对应的组合嵌入向量;然后,利用所述跨模态任务路由网络,确定所述组合嵌入向量归属于各个任务类型的第一权重;接下来,利用所述适配器路由网络,确定各个任务类型关于各个适配器的第二权重;最后,根据所述第一权重和第二权重,组合所述S个适配器分别处理所述组合嵌入向量的处理结果,得到所述旁路任务网络的旁路输出,所述旁路输出用于得到预测结果,所述预测结果用于更新所述旁路任务网络。

    多模态多任务医疗大模型训练方法及装置

    公开(公告)号:CN118097686A

    公开(公告)日:2024-05-28

    申请号:CN202410515946.5

    申请日:2024-04-25

    Inventor: 王昊文

    Abstract: 本说明书实施例涉及多模态多任务医疗大模型训练方法及装置,所述方法包括对所述大模型的旁路任务网络进行微调,所述旁路任务网络包括S个适配器、跨模态任务路由网络以及适配器路由网络;所述微调包括:首先,获取第一文本和第一图像对应的组合嵌入向量;然后,利用所述跨模态任务路由网络,确定所述组合嵌入向量归属于各个任务类型的第一权重;接下来,利用所述适配器路由网络,确定各个任务类型关于各个适配器的第二权重;最后,根据所述第一权重和第二权重,组合所述S个适配器分别处理所述组合嵌入向量的处理结果,得到所述旁路任务网络的旁路输出,所述旁路输出用于得到预测结果,所述预测结果用于更新所述旁路任务网络。

Patent Agency Ranking