-
公开(公告)号:CN117131943A
公开(公告)日:2023-11-28
申请号:CN202311178731.0
申请日:2023-09-13
Applicant: 华侨大学
IPC: G06N5/04 , G06N3/042 , G06N3/0455 , G06N3/0464 , G06F16/332 , G06F16/33
Abstract: 本发明提供一种基于问句图数据的问题链生成方法、装置及设备,方法包括:S1,在问句集中,针对问句进行槽位标签预测,利用标签向量距离创建问句间的连接关系,构建以单个问句为节点以连接为边的问句图数据;S2,将问句图数据送入图Transformer进行图表示学习,对问句图数据的节点进行嵌入表示,获得问句图数据的表示向量;S3,将待预测问句与问句图数据的表示向量通过问题链生成模型实现链接预测,得到最高置信度问句,并根据最高置信度问句与所述输入待预测问句构建链接,从而构建出两问句间的一跳问题链。本发明利用问句间的槽位关联性构建问句图,超越单纯依赖问句语义相关性所构问题链的关联性,形成逻辑性更强的问句链,实现了问题链的高效率生成。
-
公开(公告)号:CN117473959A
公开(公告)日:2024-01-30
申请号:CN202311384395.5
申请日:2023-10-24
Applicant: 华侨大学
IPC: G06F40/166 , G06F40/126 , G06F40/35
Abstract: 本发明提供了一种答案导向的风格化问句生成方法、装置、设备及存储介质,采用端到端模型将答案语料编码成答案向量,采用自编码器对问句语料和风格文本语料进行编码,分别生成问句向量和风格向量;调用平滑机制对所述风格向量以及所述答案向量进行处理,以使得离散隐空间被处理为连续的向量空间,并生成平均化向量;根据所述平均化向量融合端到端模型的隐藏空间和自编码器的隐藏空间的对其信息后在连接所述答案向量的超球体中以人工调整半径采样生成带风格的问句向量,旨在对答案语料中的指导问句生成的内容信息进行挖掘,并将其与风格信息进行分离,使内容关联性与风格特异性互不干扰,提升风格特异性的同时保证内容上的关联性。
-
公开(公告)号:CN117574230A
公开(公告)日:2024-02-20
申请号:CN202311545774.8
申请日:2023-11-20
Applicant: 华侨大学
IPC: G06F18/241 , G06F40/289 , G06F40/30 , G06F40/242 , G06F40/211
Abstract: 本发明提供了护理活动文本层级多标签分类方法、装置、设备及存储介质,涉及人工智能技术领域,首先将原始输入的护理活动文本代入提示模板,得到带有掩码标识符“mask”的提示语句子,将其输入到预训练语言模型ERNIE中,得到对应“mask”的提示语隐向量;其次,将提示语隐向量输入到标签词映射器,输出分类标签词概率向量,取概率大于阈值的标签值作为预测标签词集;最后将预测标签词集转换成层级多标签,层级多标签包含领域、措施类别、措施名称的层级多标签词集。通过该方法能缓解少样本场景下可学习的知识不足的问题,有助于更好地理解文本内容、提高分类的准确性。此外,本发明还提供了具备该方法的装置、设备及存储介质。
-
公开(公告)号:CN117573835A
公开(公告)日:2024-02-20
申请号:CN202311642501.5
申请日:2023-12-04
Applicant: 华侨大学
IPC: G06F16/332 , G06F16/33 , G06F40/279 , G06F18/22 , G06F18/23213 , G16H50/70 , G16H80/00
Abstract: 本发明提供了一种大模型微调指令自动化生成方法、装置、设备及介质,首先通过模板法构建人工指令集。接着基于提示微调构建MCT对话生成的机器指令,并基于指标度量方法对生成的MCT对话语料进行修正;接着基于最大边缘相关算法进行机器指令采样;接着基于K‑Means算法进行指令池指令采样。提出了一个面向MCT多轮对话的大模型微调指令自动化生成框架,能生成符合MCT等级标准,具有角色、话题和任务等多样性的MCT对话数据集,对医学自然语言处理的新任务以及模型评估具有重要的理论价值和应用效益。
-
-
-