一种基于多语言预训练大模型的伪语言族聚类方法及装置

    公开(公告)号:CN117688176A

    公开(公告)日:2024-03-12

    申请号:CN202311653724.1

    申请日:2023-12-04

    Abstract: 本发明涉及文本机器翻译技术领域,特别是指一种基于多语言预训练大模型的伪语言族聚类方法及装置,方法包括:建立共享语言池;基于多语言预训练大模型,计算共享语言池中的语言对的费舍信息矩阵,获得共享语言池中的语言对的表征结果;根据表征结果对语言对之间的相似度进行计算,获得相似度值;根据相似度值,对语言对之间的相似性进行排序,根据预设边界值选择符合边界值的辅助语言对,完成基于多语言预训练大模型的伪语言族聚类。本发明使用多语言预训练本身的能力对语言对进行表征,更有效地选择并聚类辅助语言并提高其在不同模型和数据集之间的泛化性,最终提高低资源语言对在多语言协同训练下的翻译质量。

    一种基于大模型的多智能体问答交互效率和性能优化方法

    公开(公告)号:CN119849644A

    公开(公告)日:2025-04-18

    申请号:CN202510333136.2

    申请日:2025-03-20

    Abstract: 本发明提供一种基于大模型的多智能体问答交互效率和性能优化方法及装置,涉及多智能体交互技术领域。该方法包括:基于多智能体,根据训练问答任务构建第一通信图以及第一图权重模型;基于第一预设轮次,根据训练数据以及第一通信图,使用无偏策略梯度估计方法对第一图权重模型进行第一阶段优化训练,获得第二图权重模型以及第二通信图;基于第二预设轮次,使用训练数据以及第二通信图,使用无偏策略梯度估计方法对第二图权重模型进行第二阶段优化训练,获得第三图权重模型;根据实际问答任务,使用第三图权重模型进行问答推理,获得实际问答推理结果。本发明是一种基于多智能体角色的效率高且鲁棒性好的多智能体问答交互效率和性能优化方法。

    基于示例感知的机器翻译大语言模型的翻译方法及装置

    公开(公告)号:CN118468899A

    公开(公告)日:2024-08-09

    申请号:CN202410933627.6

    申请日:2024-07-12

    Abstract: 本发明涉及机器翻译领域,特别是指一种基于示例感知的机器翻译大语言模型的翻译方法及装置,方法包括:构造句子级感知示例以及文档级感知示例;根据句子级感知示例、文档级感知示例构造的示例感知训练数据,根据训练数据以及低秩适应LoRA微调技术,得到训练好的机器翻译大语言模型;构造领域翻译示例以及文档级翻译示例;根据领域翻译示例以及文档级翻译示例,对训练好的机器翻译大语言模型进行优化,得到构建好的示例感知能力提升的机器翻译大语言模型,进而得到翻译结果。本发明不仅能够为特定领域翻译和文档级翻译等特定需求提供定制化解决方案,还能够在不牺牲翻译质量的前提下,显著提高翻译效率和性能。

Patent Agency Ranking