大语言模型训练、信息处理方法、装置、设备及介质

    公开(公告)号:CN120046687A

    公开(公告)日:2025-05-27

    申请号:CN202510117975.0

    申请日:2025-01-24

    Abstract: 本公开涉及一种大语言模型训练、信息处理方法、装置、设备及介质。其中,大语言模型训练方法包括:获取第一训练文本,基于待训练大语言模型计算第一训练文本中各个token分别对应的期望梯度值;对各个token分别对应的期望梯度值进行融合处理,得到正则化项;基于正则化项对待训练大语言模型进行无监督预训练,得到第一大语言模型;获取第二训练文本,基于第二训练文本对应的目标正则化项对第一大语言模型进行有监督指令微调,得到第二大语言模型,将第二大语言模型确定为训练完成的大语言模型,由此,能够将大语言模型的解释结果融入大语言模型的训练过程中,提高了训练完成的大语言模型的性能。

    基于裁判模型的大语言模型评价方法、装置、设备及介质

    公开(公告)号:CN119862889A

    公开(公告)日:2025-04-22

    申请号:CN202411940326.2

    申请日:2024-12-26

    Abstract: 本公开涉及一种基于裁判模型的大语言模型评价方法、装置、设备及介质,该方法包括:将预先获取的测试问题分别输入待评价的多个大语言模型,并获取各个大语言模型的输出结果;将测试问题、各个大语言模型的输出结果以及预设的第一引导指令输入预先建立的裁判模型,得到裁判模型输出的模型评价结果,第一引导指令用于引导裁判模型采用准确性、相关性、创造性、逻辑连贯性和信息完整性等目标评价标准对多个大语言模型的模型性能进行评价,模型评价结果包括性能最优的目标大语言模型的信息的。本公开通过将多个大语言模型针对同一问题的输出结果输入裁判模型,引导裁判模型从多角度对各个大语言模型的输出结果进行评价,能够自动对大语言模型进行全面评价。

    一种基于大模型的插件调用方法、电子设备及存储介质

    公开(公告)号:CN119759451A

    公开(公告)日:2025-04-04

    申请号:CN202411952368.8

    申请日:2024-12-27

    Abstract: 本发明涉及大语言模型技术领域,特别是涉及一种基于大模型的插件调用方法、电子设备及存储介质,所述方法包括:将预设插件关键词库中的预设插件关键词与用户输入的目标请求文本中的任一请求关键词进行匹配,根据匹配上的预设插件直接确定出目标插件或确定出若干备选插件,而当请求关键词未匹配上预设插件时则将所有预设插件作为备选插件,再通过给定大语言模型从若干个备选插件中筛选出目标插件,从所述目标请求文本中提取目标参数信息并发送至目标插件得到插件反馈结果,当插件反馈结果的判断结果为符合预设要求时,将插件反馈结果作为请求反馈文本;本发明能够提高对话系统中的目标插件选取的准确率,使选择出的目标插件更符合用户的需求。

    一种新闻推荐方法、电子设备和存储介质

    公开(公告)号:CN119357469A

    公开(公告)日:2025-01-24

    申请号:CN202411434652.6

    申请日:2024-10-15

    Abstract: 本发明涉及自然语言处理领域,提供一种新闻推荐方法、电子设备和存储介质,包括:获取新闻数据库对应的初始新闻特征;获取新闻数据库对应的用户,并基于用户对应的感兴趣新闻的初始新闻特征获取对应的初始用户特征;基于用户间相似度、用户新闻相似度、新闻间相似度、共现实体词频和用户感兴趣领域,从所述新闻数据库中获取用户潜在感兴趣的候选新闻集;对初始新闻特征进行更新,得到更新新闻特征,以及对初始用户特征进行更新,得到更新用户特征;基于更新用户特征和对应的候选新闻的更新新闻特征获取候选新闻对应的推荐值;将候选新闻集中推荐值大于预设推荐值的候选新闻作为推荐新闻并推荐给对应的用户。本发明能够为用户提供更准确的新闻。

    含不确定性引导的测试阶段训练人脸伪造检测方法及系统

    公开(公告)号:CN117275068B

    公开(公告)日:2024-05-17

    申请号:CN202311224982.8

    申请日:2023-09-21

    Abstract: 本发明公开了一种含不确定性引导的测试阶段训练人脸伪造检测方法及系统,属于深度学习以及计算机视觉技术领域,方法包括:获取待判别的图像作为初始输入图像;获取所述初始输入图像的高频信息图像;提取所述高频信息图像中不同尺度的RGB特征和频域注意力特征,将所述RGB特征和所述频域注意力特征进行融合;将所述融合后RGB特征和所述频域特征进行交叉注意力计算,得到融合特征;基于所述融合特征,并根据不同的输入图像和任务需求,自适应选择融合方式,得到判别特征,并基于所述判别特征进行分类任务。本发明充分利用频域和RGB域中有效的信息挖掘伪造痕迹,利用不确定性引导的测试阶段训练策略,对网络中的不确定性进行优化,提高了泛化性能。

    一种图像生成系统
    59.
    发明授权

    公开(公告)号:CN116823597B

    公开(公告)日:2024-05-07

    申请号:CN202310964424.9

    申请日:2023-08-02

    Abstract: 本发明涉及图像处理领域,尤其涉及一种图像生成系统,包括:目标图像A和A对应的目标语义特征向量B,所述系统实现以下步骤:将A作为待加噪图像A0,初始化加噪次数t=0,通过噪声预测模型对A0和B进行噪声预测,得到噪声预测结果Ct,对A0和Ct进行加权相加,得到加噪图像Dt,以Dt作为A0,迭代得到目标加噪图像E,将E和B输入图像生成模型中进行图像生成,得到生成图像Es,以Es作为E,迭代得到目标生成图像,通过编码噪声的形式提取A中的随机信息、面部细节和语义信息等信息,并在A上多次叠加编码得到的噪声来得到E,进一步对E和B进行多次图像生成处理得到目标生成图像,提高了目标生成图像的准确性。

Patent Agency Ranking