一种对象特征确定方法、装置、电子设备及存储介质

    公开(公告)号:CN119202372A

    公开(公告)日:2024-12-27

    申请号:CN202411110975.X

    申请日:2024-08-13

    Abstract: 本公开关于一种对象特征确定方法、装置、电子设备及存储介质,该方法将样本推荐对象的对象描述信息输入至大语言模型,通过大语言模型基于第一预设思维链提示文本进行目标交互行为的转化分析得到转化理由,该第一预设思维链提示文本用于提示针对样本推荐对象产生目标交互行为的推理过程,转化理由包括该推理过程中的至少一个维度的推理结果,进而基于该转化理由对样本推荐对象进行特征表示得到其第一对象特征,并基于样本交互对象的样本推荐对象序列中各样本推荐对象的第一对象特征确定该样本交互对象的第二对象特征。本公开提高了面向具体预估任务的对象表征的准确性并缩短了耗时,提高了面向具体预估任务的推荐概率预估模型的训练效率和准确性。

    问答模型的训练方法、装置、电子设备、存储介质及产品

    公开(公告)号:CN118153659A

    公开(公告)日:2024-06-07

    申请号:CN202410278912.9

    申请日:2024-03-12

    Abstract: 本公开实施例提供一种问答模型的训练方法、装置、电子设备、存储介质及产品,涉及机器学习技术领域。该方法包括:获取第一问答模型和第一奖励模型,第一奖励模型是根据训练样本训练得到的;基于第一奖励模型对第一问答模型进行当前一轮的强化学习训练获得第二问答模型;根据第二问答模型所生成的答案更新训练样本;根据更新后的训练样本迭代训练第一奖励模型和第二问答模型,直至训练得到的问答模型所生成的答案的奖励值大于预设奖励值时停止训练,获得目标问答模型。该方法通过强化学习训练过程得到的问答模型所生成的答案更新训练样本,利用更新后的训练样本训练奖励模型,丰富了奖励模型的训练数据,增加奖励模型对强化学习过程的指导能力。

Patent Agency Ranking