-
公开(公告)号:CN117610584A
公开(公告)日:2024-02-27
申请号:CN202311726909.0
申请日:2023-12-15
Applicant: 哈尔滨工业大学 , 无锡睿文科技有限公司
IPC: G06F40/51 , G06F18/25 , G06F40/186
Abstract: 一种基于大语言模型的翻译质量评估评分融合方法及装置,涉及人工智能技术领域。为解决现有技术中存在的,基于大语言模型的翻译质量评估评分融合效果不理想的问题,本发明提供的技术方案为:一种基于大语言模型的翻译质量评估评分融合方法,包括:获取需要进行融合的评分的步骤;选取最大的预设个评分与最小的预设个评分作为融合使用的步骤;将所述融合使用的评分代入到预设提示模板中的步骤;将加入评分的所述预设提示模板送入预设模型,获得答案的步骤。定义需要进行融合的评分个数为n,最大的评分有和最小的评分分别有n/4个。在所述n/4不整除时,商向上取整。适合应用于大语言模型的翻译质量评估工作中。
-
公开(公告)号:CN117493481A
公开(公告)日:2024-02-02
申请号:CN202311310422.4
申请日:2023-10-11
Applicant: 哈尔滨工业大学 , 无锡睿文科技有限公司
IPC: G06F16/33 , G06F16/332 , G06N3/0455 , G06N3/0499 , G06N3/08
Abstract: 一种基于自注意力机制的后交互专利检索方法及装置,涉及专利信息检索技术领域,方法包括:获取查询文本和待检索专利文本并进行预处理;将经过预处理的所述查询文本和待检索专利文本输入BERT编码器,得到查询向量和待检索专利向量,其中,所述BERT编码器为BERT模型基于专利语料预训练得到;将所述查询向量和待检索专利向量进行拼接,并输入多头自注意力模型,得到各个所述待检索专利文本对应的自注意力结果;将所述自注意力结果拼接后输入多层感知机,得到各个所述待检索专利文本的相似度评分并排序;该方法及装置将多头自注意力机制用于查询和文档的后交互,在专利检索平均准确率以及归一化折损累计增益指标上均有较大提升。
-
公开(公告)号:CN115617989A
公开(公告)日:2023-01-17
申请号:CN202211172672.1
申请日:2022-09-26
Applicant: 无锡睿文科技有限公司 , 哈尔滨工业大学
IPC: G06F16/35 , G06F40/295 , G06F40/30
Abstract: 一种中文专利关键信息语料库的构建方法、系统和计算机设备,属于专利分析技术领域,解决专利语料库的标注质量不高问题。本发明的方法包括:选取某一技术领域,并获取某一技术领域的专利数据集;确定所述专利数据集的标注范围;设置专利关键信息和若干个标注规范,对所述专利数据集进行试标注,利用一致性分析,获取试标注规范;根据所述试标注规范,获取若干个正式标注规范;根据所述若干个正式标注规范,利用多轮迭代标注策略,对所述专利数据集进行标注,建立所述某一技术领域的专利语料库。本发明适用于专利的信息检索和跨语言翻译。
-
公开(公告)号:CN117852616B
公开(公告)日:2024-05-31
申请号:CN202410229872.9
申请日:2024-02-29
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明公开了一种基于增强拒绝采样训练的大语言模型对齐微调方法和系统,涉及人工智能技术领域,包括:基于有监督微调后的大语言模型,为预设指令请求文本生成N条响应文本;基于训练好的奖励模型对每条响应文本进行评估,得到奖励分数;将N条响应文本按照对应的奖励分数由高到低排序,并选取前k条响应文本组成目标样本集;基于预设加权函数,计算每条响应文本对应的数据权重;基于预设指令请求文本、目标样本集中的响应文本和数据权重构建加权微调数据集,并基于加权微调数据集对有监督微调后的大语言模型进行对齐微调,得到目标大语言模型。本发明缓解了现有技术存在的过拟合风险高、易受有噪奖励分数干扰的技术问题。
-
公开(公告)号:CN117852616A
公开(公告)日:2024-04-09
申请号:CN202410229872.9
申请日:2024-02-29
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明公开了一种基于增强拒绝采样训练的大语言模型对齐微调方法和系统,涉及人工智能技术领域,包括:基于有监督微调后的大语言模型,为预设指令请求文本生成N条响应文本;基于训练好的奖励模型对每条响应文本进行评估,得到奖励分数;将N条响应文本按照对应的奖励分数由高到低排序,并选取前k条响应文本组成目标样本集;基于预设加权函数,计算每条响应文本对应的数据权重;基于预设指令请求文本、目标样本集中的响应文本和数据权重构建加权微调数据集,并基于加权微调数据集对有监督微调后的大语言模型进行对齐微调,得到目标大语言模型。本发明缓解了现有技术存在的过拟合风险高、易受有噪奖励分数干扰的技术问题。
-
公开(公告)号:CN120068893A
公开(公告)日:2025-05-30
申请号:CN202510107862.2
申请日:2025-01-23
Applicant: 哈尔滨工业大学
IPC: G06F40/58 , G06F40/242 , G06N3/045 , G06N3/0475 , G06N3/088 , G06N3/092 , G06N3/094 , G06N5/04
Abstract: 本发明公开了一种基于双语词典注入的机器翻译强化方法,属于机器翻译强化技术领域。解决了现有技术中传统的机器翻译强化方法针对专有领域翻译的模型性能较差的问题;本发明对大规模无监督单语语料进行双语对齐,生成双语词典;对双语词典引入平行语料,统计双语词典中各个词对在平行语料中的命中率,建立Memory Bank并记录命中率,根据命中率进行词对重要性排序,得到排序后的双语词典;通过Memory Bank对排序后的双语词典中的源端数据进行数据增强,并输入到深度对抗网络模型进行模型训练,得到训练完的深度对抗网络模型。本发明有效实现了对平行语料进行数据增强并提升机器翻译系统生成质量,可以应用于机器翻译建模。
-
公开(公告)号:CN119962547A
公开(公告)日:2025-05-09
申请号:CN202510035739.4
申请日:2025-01-09
Applicant: 哈尔滨工业大学
Abstract: 一种结合知识图谱、大语言模型与视觉想象力机制的多模态机器翻译训练方法,属于人工智能技术领域。为优化多模态机器翻译方法的图像生成质量,本发明包括人工设置待翻译句子,构建训练集1;应用文字处理库处理训练集1中的待翻译句子得到文字三元组,将训练集1中的待翻译句子输入图像生成模型生成图片后利用图像三元组提取模型处理得到图像三元组,应用两组三元组的距离性质对图像生成模型进行训练得到训练好的图像生成模型;将训练集1中的待翻译句子输入到训练好的图像生成模型待翻译句子对应生成图像进行编码处理,然后和对应的待翻译句子进行拼接后,构建训练集2,利用训练集2对大语言模型进行训练,优化大语言模型的多模态机器翻译性能。
-
公开(公告)号:CN119168064A
公开(公告)日:2024-12-20
申请号:CN202411225063.7
申请日:2024-09-03
Applicant: 哈尔滨工业大学
IPC: G06N5/04 , G06N3/0455 , G06N3/0442 , G06N3/0475 , G06N3/094 , G06F18/25 , G06F18/15 , G06F18/213 , G06F18/21 , G06F16/432 , G06F16/9032 , H04N21/854
Abstract: 一种基于统一框架的中文多模态数据生成方法,涉及自然语言处理与计算机视觉技术领域。为解决现有技术中存在的,现有的多模态大模型无法在统一的框架下高效地理解和生成包括文本、图像、视频及音频在内的多种模态数据的技术问题,本发明提供的技术方案为:包括:采集多模态数据并进行预处理;进行特征提取,得到文本特征向量和多模态特征向量;将所述多模态特征向量行特征对齐,然后将对齐后的多模态特征与所述文本特征向量进行拼接,得到用户输入数据的特征嵌入表示;嵌入表示输入多模态大模型,生成多模态内容;将生成的多模态内容进行整合,并按顺序输出。适合应用于理解和生成包括文本、图像、视频及音频在内的多模态数据的工作中。
-
公开(公告)号:CN119067236A
公开(公告)日:2024-12-03
申请号:CN202411165771.6
申请日:2024-08-23
Applicant: 哈尔滨工业大学
IPC: G06N20/00 , G06F40/284
Abstract: 一种结合system prompt减少大语言模型微调对泛化能力影响的方法及系统,属于自然语言处理技术领域,解决大模型微调后的灾难性遗忘问题。方法包括:S1:根据需要解决的专业领域问题构造训练数据模板;S2:根据所述训练数据模板获得若干训练数据;S3:混合训练数据与待微调模型的开源数据,并调整训练数据与开源数据的混合比例,获得最优混合比例;S4:根据所述最优混合比例对待微调模型进行微调,得到最终的大语言模型。本发明所述的方法可以应用在对解决部分专业领域问题有所需要,同时又希望满足大模型正常问答能力的情景。
-
公开(公告)号:CN117371576B
公开(公告)日:2024-11-01
申请号:CN202311171887.6
申请日:2023-09-12
Applicant: 哈尔滨工业大学
IPC: G06Q10/04 , G06Q50/18 , G06F18/22 , G06F18/23213 , G06F16/35 , G06N3/0464
Abstract: 一种专利授权率预测方法、系统、设备及存储介质,属于信息处理技术领域,解决现有专利审查过程中存在的无法全面检索并使用与专利相关的公开的现有技术从而导致预测的准确率下降的问题。所述方法包括:获取待测专利文献的摘要,对摘要文本进行向量化,得到摘要的向量;计算待测专利文献的余弦和公开专利数据集的余弦相似度;选取N篇与待测专利文献的余弦相似度最高的公开专利,并对其于待测专利文献进行训练,得到处理后文本和选取出的公开专利的向量表示;采集公开专利文献的主题;计算公开专利文献与其主题向量的距离,作为数据分布表示;通过卷积层、池化层和全连接层获得专利授权预测结果。本发明适用于专利授权率的预测场景。
-
-
-
-
-
-
-
-
-