-
公开(公告)号:CN117688176A
公开(公告)日:2024-03-12
申请号:CN202311653724.1
申请日:2023-12-04
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F16/35 , G06F40/58 , G06N3/0455 , G06N3/0499 , G06N3/084
Abstract: 本发明涉及文本机器翻译技术领域,特别是指一种基于多语言预训练大模型的伪语言族聚类方法及装置,方法包括:建立共享语言池;基于多语言预训练大模型,计算共享语言池中的语言对的费舍信息矩阵,获得共享语言池中的语言对的表征结果;根据表征结果对语言对之间的相似度进行计算,获得相似度值;根据相似度值,对语言对之间的相似性进行排序,根据预设边界值选择符合边界值的辅助语言对,完成基于多语言预训练大模型的伪语言族聚类。本发明使用多语言预训练本身的能力对语言对进行表征,更有效地选择并聚类辅助语言并提高其在不同模型和数据集之间的泛化性,最终提高低资源语言对在多语言协同训练下的翻译质量。
-
公开(公告)号:CN119849644A
公开(公告)日:2025-04-18
申请号:CN202510333136.2
申请日:2025-03-20
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供一种基于大模型的多智能体问答交互效率和性能优化方法及装置,涉及多智能体交互技术领域。该方法包括:基于多智能体,根据训练问答任务构建第一通信图以及第一图权重模型;基于第一预设轮次,根据训练数据以及第一通信图,使用无偏策略梯度估计方法对第一图权重模型进行第一阶段优化训练,获得第二图权重模型以及第二通信图;基于第二预设轮次,使用训练数据以及第二通信图,使用无偏策略梯度估计方法对第二图权重模型进行第二阶段优化训练,获得第三图权重模型;根据实际问答任务,使用第三图权重模型进行问答推理,获得实际问答推理结果。本发明是一种基于多智能体角色的效率高且鲁棒性好的多智能体问答交互效率和性能优化方法。
-
公开(公告)号:CN118468899A
公开(公告)日:2024-08-09
申请号:CN202410933627.6
申请日:2024-07-12
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明涉及机器翻译领域,特别是指一种基于示例感知的机器翻译大语言模型的翻译方法及装置,方法包括:构造句子级感知示例以及文档级感知示例;根据句子级感知示例、文档级感知示例构造的示例感知训练数据,根据训练数据以及低秩适应LoRA微调技术,得到训练好的机器翻译大语言模型;构造领域翻译示例以及文档级翻译示例;根据领域翻译示例以及文档级翻译示例,对训练好的机器翻译大语言模型进行优化,得到构建好的示例感知能力提升的机器翻译大语言模型,进而得到翻译结果。本发明不仅能够为特定领域翻译和文档级翻译等特定需求提供定制化解决方案,还能够在不牺牲翻译质量的前提下,显著提高翻译效率和性能。
-
公开(公告)号:CN117094329B
公开(公告)日:2024-02-02
申请号:CN202311326597.4
申请日:2023-10-13
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F40/44 , G06F40/242 , G06F40/30 , G06F40/211 , G10L15/26 , G10L15/18
Abstract: 本发明公开了一种用于解决语音歧义的语音翻译方法及装置,涉及语音翻译技术领域。包括:获取待翻译的语音数据;构建同音异义词词典;将语音数据输入到构建好的语音翻译模型;根据语音数据、同音异义词词典以及语音翻译模型,得到语音数据的翻译文本。本发明构建了一种高效的语音消歧的方法,能够有效地缓解语音翻译模型中的歧义现象,提高语音翻译的准确度。
-
-
-