一种基于知识图谱和大语言模型的后续问题生成方法

    公开(公告)号:CN119783818A

    公开(公告)日:2025-04-08

    申请号:CN202411843860.1

    申请日:2024-12-14

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于知识图谱和大语言模型的后续问题生成方法,主要用于在对话系统中生成后续问题,帮助用户探索信息并提供更好的用户体验。本发明对于给定的历史问答信息,首先进行意图识别,扩展相关背景知识,从对话中提取关键词,并构造查询以检索最相关的维基百科页面。接下来,本发明以页面对应的实体为中心构建实时知识图谱。然后,基于节点重要性和相关度两个维度选出与当前对话最相关的节点,从而确定需要引入的外部背景知识。这使得模型可以访问更广泛的知识资源,提高所生成问题的深度和相关度。最后,本发明设计了一个知识融合操作,通过指示大语言模型基于上下文继续编写先前获取的外部维基百科知识,进一步增强模型对上下文的理解和认知,指导后续问题生成。一系列实验表明,本发明方法在后续问题生成任务上具有较高的整体性能,可以生成信息更丰富、认知复杂度更高的问题,并有助于将对话推向更深层次。

    一种基于信息检索和大语言模型驱动的机器遗忘学习方法

    公开(公告)号:CN119848214A

    公开(公告)日:2025-04-18

    申请号:CN202510071938.0

    申请日:2025-01-16

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于信息检索和大语言模型驱动的机器遗忘学习方法,用于在法律领域中对知识丰富的大语言模型进行遗忘学习。对于给定的用户查询,重新定义了遗忘学习任务,采取不改动模型参数的方式,通过为模型添加禁止访问遗忘集的权限,从而使模型拒绝回答有关遗忘集的信息,达到遗忘学习目标。首先通过混合检索机制将用户查询在遗忘集语料中执行信息检索。然后基于本发明设计的重排序器,将检索出的段落按照相关性重新排序。接着将最相关的前n个段落输入到基于大语言模型的校验器中进行校验,进一步明确用户查询是否涉及遗忘集的信息。本发明方法在遗忘学习任务上具有较高的整体性能,能够在实现精准可靠的遗忘学习的同时,兼顾效率与成本。

    基于多视角聚类与混合检索的法律概念解释方法

    公开(公告)号:CN119760113A

    公开(公告)日:2025-04-04

    申请号:CN202411843859.9

    申请日:2024-12-14

    Applicant: 东南大学

    Abstract: 本申请公开了一种基于多视角聚类和混合检索的法律概念解释方法,该方法首先将用户输入解析成为法律概念。其次,通过多视角聚类方法抽取具有多样性的相关法律案例,而后提取这些法律案例中涉及到的法律条文并在数据库上检索,并使用大语言模型检索生成用户查询可能涉及到的法律条文(即混合检索步骤)。之后,在法律概念数据库上检索解析概念的具体定义,并且搜索相关法律案例和法律条文中给出的关键词信息,将这些关键词作为相关概念并检索,将解析概念和关键词的集合作为总相关概念集合。最后,将相关概念和相关法条组织成为提示输入到大语言模型生成初始结果,接下来将生成结果和输入提示以及初始问题投入到大语言模型中进行反思,进而生成最终结果,并将法律案例附在生成结果后输出给用户查看。

Patent Agency Ranking