对话情感分析模型的训练方法以及相关装置

    公开(公告)号:CN118626914A

    公开(公告)日:2024-09-10

    申请号:CN202410843716.1

    申请日:2024-06-26

    Abstract: 本申请公开了一种对话情感分析模型的训练方法以及相关装置,该训练方法包括:获取当前轮次的训练样本;利用多种数据屏蔽方式对训练样本进行调整,得到多种调整样本,并将训练样本及其对应的调整样本输入对话情感分析模型,得到多种情感下训练样本中每个对话段对应的第一预测分布,以及每个调整样本中每个对话段对应的第二预测分布;其中,数据屏蔽方式与数据的模态和生成对象中的至少一者相关;基于训练标签、第一预测分布和第二预测分布,调整对话情感分析模型的参数,直至满足预设收敛条件,得到训练后的对话情感分析模型。本申请的训练方法能够提升模型对不确定性样本的理解和处理。

    文本回复方法、电子设备和计算机可读存储介质

    公开(公告)号:CN118674039A

    公开(公告)日:2024-09-20

    申请号:CN202410573530.9

    申请日:2024-05-09

    Abstract: 本申请公开了一种文本回复方法、电子设备和计算机可读存储介质,该方法包括:获取用户选择的目标模型;目标模型对应有教师模型,且均属于对话生成模型,教师模型是利用历史对话文本训练得到的,多个历史对话文本的预测难度相互区别,预测难度与历史对话文本的文本长度和词汇出现频率中的至少一者相关,训练后的教师模型用于指导待训练学生模型对历史对话文本进行回复预测,且在迭代过程中教师模型基于待训练学生模型的预测损失,选择相应预测难度的历史对话文本,直至得到训练后的待训练学生模型作为目标模型;获取用户输入的待回复文本,将待回复文本输入目标模型,得到回复文本。上述方案,能够增强对话生成模型的性能以提高文本回复的准确率。

    一种任务描述增强的分子表征学习系统

    公开(公告)号:CN119649944A

    公开(公告)日:2025-03-18

    申请号:CN202411672345.1

    申请日:2024-11-21

    Abstract: 一种任务描述增强的分子表征学习系统,本发明属于计算机领域人工智能中分子表征学习领域,具体涉及任务描述增强的分子表征学习系统。本发明为解决现有技术中通用分子表征难以捕获任务特异性特征、在标注数据稀缺场景下泛化性能不足,导致分子表征学习准确性低以及可解释性较差的问题。系统包括:基于任务描述的多回归任务数据集构建模块、双塔模型构建模块、双塔模型训练模块、预测模块;基于任务描述的多回归任务数据集构建模块用于构建基于任务描述的多回归任务数据集;双塔模型构建模块用于构建双塔模型;双塔模型训练模块用于获取训练好的双塔模型;预测模块用于将待测分子输入训练好的双塔模型,训练好的双塔模型输出任务相关分子表征。

    一种基于数据对齐的大语言模型回复生成方法及系统

    公开(公告)号:CN119474269A

    公开(公告)日:2025-02-18

    申请号:CN202411529670.2

    申请日:2024-10-30

    Abstract: 一种基于数据对齐的大语言模型回复生成方法及系统,它属于大语言模型回复生成领域。本发明解决了现有大语言模型有害输出的风险大的问题。本发明首先通过COD提示收集有害问题数据集和无害问题数据集,并利用收集的数据集对模型进行预训练,再利用收集的数据集和提出的对齐策略对模型进行训练,以最小化有害响应的负对数似然,同时惩罚有害响应,通过梯度上升优化样本损失,以强化模型的正面行为。然后通过向对齐后的模型权重中添加一个安全向量来校正模型的安全性,可以在保持模型原始任务性能的同时补偿模型的安全性损失,显著降低模型产生有害输出的概率。本发明方法可以应用于大语言模型安全回复生成领域。

    面向多跳问题的大语言模型推理问答增强方法

    公开(公告)号:CN119378686A

    公开(公告)日:2025-01-28

    申请号:CN202411501095.5

    申请日:2024-10-25

    Abstract: 面向多跳问题的大语言模型推理问答增强方法,涉及大语言模型的推理增强技术领域。本发明是为了解决现有的大语言模型推理问答方法还存在推理准确率低的问题。本发明包括:将问题构建为问题树,并对问题树进行后序遍历;对于叶节点,获取问题树中叶节点的对应子问题的候选答案及候选答案的概率分布;对于问题树中的中间节点,对中间节点对应的子问题进行波束组合,将问题中的占位符替换为对应问题的答案,获取替换后的问题的候选答案集合及分布概率。对于根节点对应的子问题进行波束组合,将问题中的占位符替换为对应问题的答案,然后输出替换后问题的候选答案及概率分布,选择对应概率最高的答案作为最终答案。本发明用于推理获得多跳问题的答案。

    一种基于一阶自然逻辑的多项选择问答系统

    公开(公告)号:CN119046431A

    公开(公告)日:2024-11-29

    申请号:CN202411158824.1

    申请日:2024-08-22

    Abstract: 本发明公开了一种基于一阶自然逻辑的多项选择问答系统,包括:预处理模块,用于将问题和候选答案转化为假设;一阶逻辑模块,用于利用一阶逻辑将假设分解为子假设;自然逻辑模块,用于利用自然逻辑从外部语料库改写前提,产生与原始前提传达相同含义的中间前提,并以预定义的最大推理深度λ作为停止标准,迭代生成前提到假设的推理路径;框架构建模块,用于结合一阶逻辑与自然逻辑,集成神经网络构建神经符号推理框架;结果输出模块,用于基于神经符号推理框架,计算中间前提和子假设之间的语义相似度,根据相似度得分输出得分最高的最终选择答案。本发明不仅缩短了推理路径,而且增强了动词短语的对齐。

    基于文本和图像的多模态命名实体识别系统

    公开(公告)号:CN118052235A

    公开(公告)日:2024-05-17

    申请号:CN202410291917.5

    申请日:2024-03-14

    Abstract: 基于文本和图像的多模态命名实体识别系统,为了解决现有的基于多模态实体识别的系统存在多模态实体识别精度低的问题。本发明基于文本得到文本对应的字级表示、句子级表示以及片段级表示,基于图像获得粗粒度图片对应的特征表示、描述文本表示,以及细粒度图片对应的表示、描述文本表示;然后对特定图像粒度的图像表示进行多模态融合,分别按照考虑及不考虑时间动态的方式将不同图像粒度的表示融合,使用融合表示获得由不同文本粒度查询的多模态表示,再分别使用两个独立的MLP网络层,得到每个实体片段的边界位置和实体片段对应的实体类别的分类概率,结合去噪扩散模型,重复迭代预测,最终实现对实体片段位置和实体类别的预测。

Patent Agency Ranking