-
公开(公告)号:CN118628614A
公开(公告)日:2024-09-10
申请号:CN202411107024.7
申请日:2024-08-13
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明涉及人工智能技术领域,特别是指一种基于少样本学习的大语言模型的图到文本生成方法及装置。方法包括:构建正例样本和负例样本,对初始的图神经网络进行训练,得到图编码器,设定四个不同的训练任务,获取分别对应的训练样本,对初始的线性网络进行训练,得到图到文本投影器;选取少样本学习样本,使用少样本学习样本对预训练的大语言模型进行微调,根据图编码器、图到文本投影器以及微调后的大语言模型,得到训练好的基于大语言模型的图到文本生成模型;获取待生成图,将待生成图输入训练好的基于大语言模型的图到文本生成模型,得到待生成图对应的生成文本。采用本发明,可以降低对大规模标注数据集的依赖,提高训练的模型的准确度。
-
公开(公告)号:CN117787421B
公开(公告)日:2024-05-31
申请号:CN202410201337.2
申请日:2024-02-23
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06N5/04 , G06F40/166
Abstract: 本发明公开了一种基于思维链确定问题答案的方法和装置、电子设备,属于人工智能技术领域,所述方法包括:获取待解答问题以及多个样本数据,其中,每个所述样本数据包括:一个问题和所述问题对应的第一求解计划;将所述待解答问题与多个所述样本数据进行拼接后输入模型,得到待解答问题对应的第二求解计划;控制所述模型按照所述第二求解计划中的每个步骤执行求解,直至完成最后一个步骤,得到目标答案。本申请提供的基于思维链确定问题答案的方案,既能够赋予思维链纠错能力,又可以人为或者模型自动干预对第二求解计划中的第一步骤进行修正。
-
公开(公告)号:CN118038870A
公开(公告)日:2024-05-14
申请号:CN202410440333.X
申请日:2024-04-12
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明涉及自然语言处理技术领域,特别是指一种针对大语音模型的指令感知训练方法及装置。针对大语音模型的指令感知训练方法包括:使用麦克风采集音频,获取目标原始数据以及指令音频;根据目标原始数据,获得目标文本数据以及目标音频数据;根据指令音频,获得第一指令文本;根据目标文本数据以及第一指令文本,通过文本大模型进行数据生成,获得指令感知文本数据;对第一指令文本进行差异化处理,获得第二指令文本;根据指令感知文本数据、目标音频数据和第二指令文本,对大语音模型进行优化训练,获得优化大语音模型。本发明是一种面向大语音模型的有效缓解指令跟随能力缺陷的大语音模型训练方法。
-
公开(公告)号:CN117669721B
公开(公告)日:2024-04-19
申请号:CN202410139850.3
申请日:2024-02-01
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06N5/022 , G06N3/0455 , G06N3/08
Abstract: 本申请适用于计算机领域,提供了信息抽取方法、装置、电子设备及计算机存储介质,包括:获取待抽取文本;将所述待抽取文本输入信息抽取模型,其中,所述信息抽取模型是基于预训练模型进行训练获得的,所述预训练模型是对预训练语料库进行实体知识训练获得的;根据所述信息抽取模型输出的信息抽取结果,获得所述待抽取文本对应的目标信息。本申请通过采用经过实体知识训练的信息提取模型对待抽取文本进行处理,从而提取出表征待提取文本实体知识以及实体关系的内容,提高了信息抽取结果中实体语义关联性。
-
公开(公告)号:CN117688176A
公开(公告)日:2024-03-12
申请号:CN202311653724.1
申请日:2023-12-04
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F16/35 , G06F40/58 , G06N3/0455 , G06N3/0499 , G06N3/084
Abstract: 本发明涉及文本机器翻译技术领域,特别是指一种基于多语言预训练大模型的伪语言族聚类方法及装置,方法包括:建立共享语言池;基于多语言预训练大模型,计算共享语言池中的语言对的费舍信息矩阵,获得共享语言池中的语言对的表征结果;根据表征结果对语言对之间的相似度进行计算,获得相似度值;根据相似度值,对语言对之间的相似性进行排序,根据预设边界值选择符合边界值的辅助语言对,完成基于多语言预训练大模型的伪语言族聚类。本发明使用多语言预训练本身的能力对语言对进行表征,更有效地选择并聚类辅助语言并提高其在不同模型和数据集之间的泛化性,最终提高低资源语言对在多语言协同训练下的翻译质量。
-
公开(公告)号:CN117669721A
公开(公告)日:2024-03-08
申请号:CN202410139850.3
申请日:2024-02-01
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06N5/022 , G06N3/0455 , G06N3/08
Abstract: 本申请适用于计算机领域,提供了信息抽取方法、装置、电子设备及计算机存储介质,包括:获取待抽取文本;将所述待抽取文本输入信息抽取模型,其中,所述信息抽取模型是基于预训练模型进行训练获得的,所述预训练模型是对预训练语料库进行实体知识训练获得的;根据所述信息抽取模型输出的信息抽取结果,获得所述待抽取文本对应的目标信息。本申请通过采用经过实体知识训练的信息提取模型对待抽取文本进行处理,从而提取出表征待提取文本实体知识以及实体关系的内容,提高了信息抽取结果中实体语义关联性。
-
公开(公告)号:CN119849644A
公开(公告)日:2025-04-18
申请号:CN202510333136.2
申请日:2025-03-20
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供一种基于大模型的多智能体问答交互效率和性能优化方法及装置,涉及多智能体交互技术领域。该方法包括:基于多智能体,根据训练问答任务构建第一通信图以及第一图权重模型;基于第一预设轮次,根据训练数据以及第一通信图,使用无偏策略梯度估计方法对第一图权重模型进行第一阶段优化训练,获得第二图权重模型以及第二通信图;基于第二预设轮次,使用训练数据以及第二通信图,使用无偏策略梯度估计方法对第二图权重模型进行第二阶段优化训练,获得第三图权重模型;根据实际问答任务,使用第三图权重模型进行问答推理,获得实际问答推理结果。本发明是一种基于多智能体角色的效率高且鲁棒性好的多智能体问答交互效率和性能优化方法。
-
公开(公告)号:CN119721258A
公开(公告)日:2025-03-28
申请号:CN202510206425.6
申请日:2025-02-25
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) , 中国科学院计算技术研究所
IPC: G06N5/04 , G06N3/0475 , G06N3/094 , G06N3/045
Abstract: 本发明提供一种语音大模型的自适应层次表征对齐训练方法及装置,涉及自然语言处理技术领域;该方法包括:基于内部语音适应器,根据候选语音大模型,使用源语音以及文本提示词进行模型训练,获得第一语音大模型;基于跨模态语义检索任务,根据源语音以及源语音转录文本,对第一语音大模型的进行语义检索能力筛选,获得最优神经网络层级;基于最优神经网络层级,根据源语音、文本提示词和源语音转录文本,通过第一语音大模型进行预测,并计算模型预测损失;根据模型预测损失,对第一语音大模型进行参数优化,获得第二语音大模型;本发明是一种充分利用源语音和转录文本的映射关系的高效且准确的自适应层次表征对齐训练方法。
-
公开(公告)号:CN119476410A
公开(公告)日:2025-02-18
申请号:CN202510026657.3
申请日:2025-01-08
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06N3/096
Abstract: 本发明属于人工智能与深度学习领域,为了解决新旧知识的不平衡和适配性差的问题,提供基于持续知识保护分解的小样本持续学习方法及系统。其中,基于持续知识保护分解的小样本持续学习方法包括基于每个类别的回放样本数据及持续学习模型骨干网络,经奇异值分解得到知识敏感成分和冗余容量成分;在增量适配训练过程中,冻结知识敏感成分所对应的预训练线性权重矩阵;同时利用冗余容量成分来构建可学习的适配器,更新预训练线性权重矩阵;重新获取小样本回放数据,基于更新后的预训练线性权重矩阵再次进行奇异值分解及增量适配训练操作。其通过协方差矩阵的动态更新,实现了新旧知识的平衡和高效适配,提高了分类结果的准确性。
-
公开(公告)号:CN118939783A
公开(公告)日:2024-11-12
申请号:CN202411429185.8
申请日:2024-10-14
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F16/332 , G06F16/36 , G06F18/27 , G06F18/214
Abstract: 本发明提供一种基于知识图谱检索增强的大模型推理方法及装置,涉及自然语言处理技术领域。该方法包括:使用ChatGPT生成多指令微调数据集;根据多指令微调数据集,对大语言模型进行自回归训练,获得微调后大语言模型;基于知识图谱,根据知识密集型查询以及知识实体集合,通过微调后大语言模型进行迭代推理,获得第一证据子图;基于回归评分器以及预设得分阈值,对第一证据子图进行剪枝,获得第二证据子图;基于第二提示模板,根据第二证据子图以及知识密集型查询,通过微调后大语言模型进行联合推理,获得查询推理结果。本发明是一种基于知识图谱增强的有效结合外部知识且回答复杂多跳问题准确的大模型推理方法。
-
-
-
-
-
-
-
-
-