-
公开(公告)号:CN119311796A
公开(公告)日:2025-01-14
申请号:CN202411264439.5
申请日:2024-09-10
Applicant: 北京理工大学东南信息技术研究院
IPC: G06F16/332 , G06F18/2411 , G06F18/214 , G06F40/186
Abstract: 本申请提供一种用于合成特定领域多轮对话数据的方法,方法包括:步骤一、进行数据集嵌入并进行降维;将文本形式的数据集转换为高维特征向量形式,并进行降维,转换为二维向量形式;步骤二、构建对话合成器的训练数据集;步骤三、使用对抗学习训练对话数据合成器;步骤四、使用对话合成器合成特定领域的数据集;步骤五、基于规则对合成数据进行清洗与筛选。本申请提供的方法填补特定领域对话数据的空缺,增强模型在特定领域的专业能力,降低合成数据的成本。
-
公开(公告)号:CN119337864A
公开(公告)日:2025-01-21
申请号:CN202411298131.2
申请日:2024-09-18
Applicant: 北京理工大学东南信息技术研究院
IPC: G06F40/232 , G06F40/30 , G06F40/186
Abstract: 本申请提供一种融合用户语义和过往纠错记录的纠错大模型迭代训练方法,方法包括:纠错元数据构造:利用大模型指令数据集的构造方式,对篇章句子在内的数据进行纠错元数据的构造;输入为用户指定的待纠错文本;通过接受批改大模型的输出,调用动态反馈模块将批阅反馈发送给用户决策模块;用户决策模块接受输出结果,进行纠错意见和纠错结果的满意度反馈,并将用户的满意度反馈结果进行记录和重新组装,返回给动态反馈模块。本申请能够更准确地识别和纠正作文中的错误。
-
公开(公告)号:CN119311797A
公开(公告)日:2025-01-14
申请号:CN202411264441.2
申请日:2024-09-10
Applicant: 北京理工大学东南信息技术研究院
IPC: G06F16/332 , G06F16/33 , G06N5/04 , G06F18/2411 , G06F18/214
Abstract: 本申请提供一种基于情感信息的人格识别方法,方法包括:步骤一,对会话中的人格识别进行定义,将会话中的人格识别问题形式化为自然语言推理I问题;步骤二,构建情感对话内容;步骤三,构建人格描述;整理并总结每个人格特质的积极和消极描述,描述用于在NLI问题中作为假设,提供关于行为特征和情感表达倾向的详细信息;步骤四,训练并推理自然语言推理。本申请提高了人机交互的互动质量和个性化体验。
-
公开(公告)号:CN113342953A
公开(公告)日:2021-09-03
申请号:CN202110675321.1
申请日:2021-06-18
Applicant: 北京理工大学东南信息技术研究院 , 中国科学院信息工程研究所
IPC: G06F16/332 , G06F16/33 , G06F40/289 , G06Q50/26
Abstract: 本发明适用于智能问答领域,提供了一种基于多模型集成的政务问答方法。本发明将实际政务问答的复杂场景分解为多个部分,集成多种特定用途的在不同数据集上微调的预训练语言模型,分别进行FAQ问答对匹配、阅读理解以及层级检索以获取答案和可解释性证据,之后使用无监督答案验证方法对得到的答案和可解释性证据进一步验证,从而充分利用不同模型进行答案信息互补,提高政务问答的质量。采取的阅读理解模型经过无监督检索后能够快速推理并且层级检索方法非常高效,从而保证政务问答的实时性要求。多模型集成的使用能够进一步提高问答准确率,同时提供答案对应的可解释性证据。此外,无监督方法的特性使得该发明能够轻易移植到其他实际问答场景中。
-
-
-