-
公开(公告)号:CN118277609A
公开(公告)日:2024-07-02
申请号:CN202410325209.9
申请日:2024-03-20
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) , 北京达佳互联信息技术有限公司
IPC: G06F16/738 , G06F16/75 , H04N21/488 , G06Q50/20
Abstract: 本公开关于一种视频标注方法、装置、电子设备、存储介质和计算机程序产品,该方法包括:获取与目标教学任务关联的教学视频集合;提取出所述教学视频集合中各教学视频的视频字幕,通过生成式语言模型的步骤提取功能处理各所述教学视频的视频字幕,生成各所述教学视频对应的步骤提取结果;所述步骤提取结果包括所述教学视频中的各教学步骤对应的步骤内容和各所述教学步骤对应的时间戳;通过所述生成式语言模型的大纲生成功能处理各所述教学视频对应的步骤提取结果,生成所述目标教学任务的教学大纲。采用本方法能够提高对教学视频的信息获取效率。
-
公开(公告)号:CN118626914A
公开(公告)日:2024-09-10
申请号:CN202410843716.1
申请日:2024-06-26
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F18/24 , G06F18/214 , G06N20/00 , G06F40/35
Abstract: 本申请公开了一种对话情感分析模型的训练方法以及相关装置,该训练方法包括:获取当前轮次的训练样本;利用多种数据屏蔽方式对训练样本进行调整,得到多种调整样本,并将训练样本及其对应的调整样本输入对话情感分析模型,得到多种情感下训练样本中每个对话段对应的第一预测分布,以及每个调整样本中每个对话段对应的第二预测分布;其中,数据屏蔽方式与数据的模态和生成对象中的至少一者相关;基于训练标签、第一预测分布和第二预测分布,调整对话情感分析模型的参数,直至满足预设收敛条件,得到训练后的对话情感分析模型。本申请的训练方法能够提升模型对不确定性样本的理解和处理。
-
公开(公告)号:CN118674039A
公开(公告)日:2024-09-20
申请号:CN202410573530.9
申请日:2024-05-09
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06N5/04 , G06F16/332 , G06F16/35 , G06N3/096
Abstract: 本申请公开了一种文本回复方法、电子设备和计算机可读存储介质,该方法包括:获取用户选择的目标模型;目标模型对应有教师模型,且均属于对话生成模型,教师模型是利用历史对话文本训练得到的,多个历史对话文本的预测难度相互区别,预测难度与历史对话文本的文本长度和词汇出现频率中的至少一者相关,训练后的教师模型用于指导待训练学生模型对历史对话文本进行回复预测,且在迭代过程中教师模型基于待训练学生模型的预测损失,选择相应预测难度的历史对话文本,直至得到训练后的待训练学生模型作为目标模型;获取用户输入的待回复文本,将待回复文本输入目标模型,得到回复文本。上述方案,能够增强对话生成模型的性能以提高文本回复的准确率。
-
公开(公告)号:CN117764107A
公开(公告)日:2024-03-26
申请号:CN202410009630.9
申请日:2024-01-02
Applicant: 北京达佳互联信息技术有限公司 , 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06N3/004 , G06N3/0455 , G06N3/042 , G06N3/092
Abstract: 本公开提供了一种智能体生成方法、装置、电子设备及存储介质,涉及计算机技术领域。该方法包括:根据初始智能体的初始角色设定值,确定当前学习任务,当前学习任务包括至少一个任务操作;基于当前学习任务与多媒体资源交互平台的环境信息,生成每个任务操作的任务操作指令;基于任务操作指令执行任务操作,得到任务操作对应的任务执行结果;根据任务执行结果与环境信息更新初始角色设定值,直至更新后的角色设定信息与角色构建目标相适配,得到目标智能体。本公开可以提供一种具备自主进行内容交互,并学习对应知识的能力的智能体生成方案。
-
公开(公告)号:CN119938006A
公开(公告)日:2025-05-06
申请号:CN202510306265.2
申请日:2025-03-14
Applicant: 哈尔滨工业大学 , 哈尔滨海邻科信息技术有限公司
Abstract: 面向复杂需求的大语言模型代码生成系统及方法,本申请从主要问题开始,引入新的函数来处理特定的子问题。这些新函数将递归地分解,最终形成一个函数树。随后,自下而上地组合这些函数,以实现越来越复杂的目标。通过将任务分解为更简单的子函数,复杂度可以逐步降低。然而,子函数中的错误可能传播到整个程序,进而损害整体的可靠性。本申请提出的功能共识机制会对多个函数进行采样,并选择在候选函数中表现出共识的函数,其共识通过聚合相似性来衡量。通过达成共识,本申请能够减少代码行为的差异,从而缓解连锁错误的发生,进而提升了代码生成的准确率。
-
公开(公告)号:CN119649944A
公开(公告)日:2025-03-18
申请号:CN202411672345.1
申请日:2024-11-21
Applicant: 哈尔滨工业大学
Abstract: 一种任务描述增强的分子表征学习系统,本发明属于计算机领域人工智能中分子表征学习领域,具体涉及任务描述增强的分子表征学习系统。本发明为解决现有技术中通用分子表征难以捕获任务特异性特征、在标注数据稀缺场景下泛化性能不足,导致分子表征学习准确性低以及可解释性较差的问题。系统包括:基于任务描述的多回归任务数据集构建模块、双塔模型构建模块、双塔模型训练模块、预测模块;基于任务描述的多回归任务数据集构建模块用于构建基于任务描述的多回归任务数据集;双塔模型构建模块用于构建双塔模型;双塔模型训练模块用于获取训练好的双塔模型;预测模块用于将待测分子输入训练好的双塔模型,训练好的双塔模型输出任务相关分子表征。
-
公开(公告)号:CN119474269A
公开(公告)日:2025-02-18
申请号:CN202411529670.2
申请日:2024-10-30
IPC: G06F16/332 , G06N5/04
Abstract: 一种基于数据对齐的大语言模型回复生成方法及系统,它属于大语言模型回复生成领域。本发明解决了现有大语言模型有害输出的风险大的问题。本发明首先通过COD提示收集有害问题数据集和无害问题数据集,并利用收集的数据集对模型进行预训练,再利用收集的数据集和提出的对齐策略对模型进行训练,以最小化有害响应的负对数似然,同时惩罚有害响应,通过梯度上升优化样本损失,以强化模型的正面行为。然后通过向对齐后的模型权重中添加一个安全向量来校正模型的安全性,可以在保持模型原始任务性能的同时补偿模型的安全性损失,显著降低模型产生有害输出的概率。本发明方法可以应用于大语言模型安全回复生成领域。
-
公开(公告)号:CN119378686A
公开(公告)日:2025-01-28
申请号:CN202411501095.5
申请日:2024-10-25
Applicant: 哈尔滨工业大学
Abstract: 面向多跳问题的大语言模型推理问答增强方法,涉及大语言模型的推理增强技术领域。本发明是为了解决现有的大语言模型推理问答方法还存在推理准确率低的问题。本发明包括:将问题构建为问题树,并对问题树进行后序遍历;对于叶节点,获取问题树中叶节点的对应子问题的候选答案及候选答案的概率分布;对于问题树中的中间节点,对中间节点对应的子问题进行波束组合,将问题中的占位符替换为对应问题的答案,获取替换后的问题的候选答案集合及分布概率。对于根节点对应的子问题进行波束组合,将问题中的占位符替换为对应问题的答案,然后输出替换后问题的候选答案及概率分布,选择对应概率最高的答案作为最终答案。本发明用于推理获得多跳问题的答案。
-
公开(公告)号:CN119046431A
公开(公告)日:2024-11-29
申请号:CN202411158824.1
申请日:2024-08-22
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于一阶自然逻辑的多项选择问答系统,包括:预处理模块,用于将问题和候选答案转化为假设;一阶逻辑模块,用于利用一阶逻辑将假设分解为子假设;自然逻辑模块,用于利用自然逻辑从外部语料库改写前提,产生与原始前提传达相同含义的中间前提,并以预定义的最大推理深度λ作为停止标准,迭代生成前提到假设的推理路径;框架构建模块,用于结合一阶逻辑与自然逻辑,集成神经网络构建神经符号推理框架;结果输出模块,用于基于神经符号推理框架,计算中间前提和子假设之间的语义相似度,根据相似度得分输出得分最高的最终选择答案。本发明不仅缩短了推理路径,而且增强了动词短语的对齐。
-
公开(公告)号:CN118052235A
公开(公告)日:2024-05-17
申请号:CN202410291917.5
申请日:2024-03-14
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06V10/40 , G06F18/2415 , G06F18/25 , G06N3/0455 , G06N3/048 , G06N3/047 , G06V10/82 , G06N3/045 , G06N3/08
Abstract: 基于文本和图像的多模态命名实体识别系统,为了解决现有的基于多模态实体识别的系统存在多模态实体识别精度低的问题。本发明基于文本得到文本对应的字级表示、句子级表示以及片段级表示,基于图像获得粗粒度图片对应的特征表示、描述文本表示,以及细粒度图片对应的表示、描述文本表示;然后对特定图像粒度的图像表示进行多模态融合,分别按照考虑及不考虑时间动态的方式将不同图像粒度的表示融合,使用融合表示获得由不同文本粒度查询的多模态表示,再分别使用两个独立的MLP网络层,得到每个实体片段的边界位置和实体片段对应的实体类别的分类概率,结合去噪扩散模型,重复迭代预测,最终实现对实体片段位置和实体类别的预测。
-
-
-
-
-
-
-
-
-