-
公开(公告)号:CN117828072A
公开(公告)日:2024-04-05
申请号:CN202311463653.9
申请日:2023-11-06
Applicant: 中国矿业大学(北京)
IPC: G06F16/35 , G06N3/042 , G06F16/332 , G06N3/0455
Abstract: 本发明公开了一种基于异构图神经网络的对话分类方法和系统,包括:数据准备:收集对话数据集,并将对话划分为句子节点和词节点。根据对话数据集构建异构图;为每个节点初始化隐藏状态,使用基于BERT的嵌入来捕获丰富的语义信息,使用节点特征作为初始表示向量。构建异构图神经网络模型;更新节点;进行对话分类。本发明的优点是:具有捕捉细微差别的语言模式、上下文依赖关系和跨对话不断变化的用户意图的能力,提升了对话分类的准确性和效果。
-
公开(公告)号:CN118821942A
公开(公告)日:2024-10-22
申请号:CN202410855215.5
申请日:2024-06-28
Applicant: 中国矿业大学(北京) , 中铁十五局集团有限公司
Abstract: 一种针对大语言模型的数学推理训练集的生成方法包括:获取数学领域开源数据集;为开源数据集中的数学问题设计文字提示;为开源数据集中的每个数学问题生成期望输出程序:将开源数据集中的每个数学问题分别和文字提示输入至闭源大语言模型中得到每个数学问题对应的期望输出程序;利用外部解释器运行期望输出程序,若运行结果正确,则将当前数学问题和其对应的期望输出程序加入至训练集中;若运行结果错误,则舍弃当前数学问题。用本方法生成的训练集对开源大语言模型进行指令微调,以此提升开源大语言模型解决各种数学领域问题的能力,缩小与闭源大语言模型之间的差距。
-
公开(公告)号:CN117828072B
公开(公告)日:2024-08-16
申请号:CN202311463653.9
申请日:2023-11-06
Applicant: 中国矿业大学(北京)
IPC: G06F16/35 , G06N3/042 , G06F16/332 , G06N3/0455
Abstract: 本发明公开了一种基于异构图神经网络的对话分类方法和系统,包括:数据准备:收集对话数据集,并将对话划分为句子节点和词节点。根据对话数据集构建异构图;为每个节点初始化隐藏状态,使用基于BERT的嵌入来捕获丰富的语义信息,使用节点特征作为初始表示向量。构建异构图神经网络模型;更新节点;进行对话分类。本发明的优点是:具有捕捉细微差别的语言模式、上下文依赖关系和跨对话不断变化的用户意图的能力,提升了对话分类的准确性和效果。
-
-