一种基于知识图谱和大语言模型的后续问题生成方法

    公开(公告)号:CN119783818A

    公开(公告)日:2025-04-08

    申请号:CN202411843860.1

    申请日:2024-12-14

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于知识图谱和大语言模型的后续问题生成方法,主要用于在对话系统中生成后续问题,帮助用户探索信息并提供更好的用户体验。本发明对于给定的历史问答信息,首先进行意图识别,扩展相关背景知识,从对话中提取关键词,并构造查询以检索最相关的维基百科页面。接下来,本发明以页面对应的实体为中心构建实时知识图谱。然后,基于节点重要性和相关度两个维度选出与当前对话最相关的节点,从而确定需要引入的外部背景知识。这使得模型可以访问更广泛的知识资源,提高所生成问题的深度和相关度。最后,本发明设计了一个知识融合操作,通过指示大语言模型基于上下文继续编写先前获取的外部维基百科知识,进一步增强模型对上下文的理解和认知,指导后续问题生成。一系列实验表明,本发明方法在后续问题生成任务上具有较高的整体性能,可以生成信息更丰富、认知复杂度更高的问题,并有助于将对话推向更深层次。

    一种基于智能问答的具有广告屏蔽功能的传真机

    公开(公告)号:CN109547659A

    公开(公告)日:2019-03-29

    申请号:CN201811438454.1

    申请日:2018-11-28

    Applicant: 东南大学

    Abstract: 本发明涉及一种基于智能问答的具有广告屏蔽功能的传真机,该传真机中设有灰名单列表和智能问答模块,对于每个拨入的传真号码,通过智能问答模块根据号码与白名单、黑名单和灰名单中的号码进行匹配,若能匹配成功且判定为白名单中已知传真,则振铃通知机主并接收传真,若能匹配成功且判定为黑名单中已知传真,则直接拦截,若能匹配成功且判定为灰名单中已知传真,或者若匹配不成功判定为陌生传真,则启用机器人与传真者进行智能问答,并根据问答内容提取标记词,通过标记词匹配判定是否振铃通知机主接受传真或加入灰名单或加入黑名单。本传真机能够有效地判别陌生传真是否为广告骚扰类的垃圾传真,从而可有效实现广告传真精准屏蔽的问题。

    一种基于多维度分类标签的医患纠纷类案件推荐方法

    公开(公告)号:CN108280149A

    公开(公告)日:2018-07-13

    申请号:CN201810007270.3

    申请日:2018-01-04

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于多维度分类标签的医患纠纷类案件推荐方法,包括:(1)定义医患纠纷案件的争议焦点模板,每个争议焦点模板内包括多个要素;(2)以争议焦点模板中的要素作为基本标签,建立医患纠纷案件的多维度分类标签体系;(3)采用正则表达式定义抽取规则,从医患纠纷类案件中抽取争议焦点,为每个案件形成一个多维度分类标签;(4)根据用户的查询语句生成多维度分类标签,并计算其与每个案件的多维度分类标签的相似度,按照相似度最高到最低的排序为用户推荐案件。本发明准确度更高。

    基于多视角聚类与混合检索的法律概念解释方法

    公开(公告)号:CN119760113A

    公开(公告)日:2025-04-04

    申请号:CN202411843859.9

    申请日:2024-12-14

    Applicant: 东南大学

    Abstract: 本申请公开了一种基于多视角聚类和混合检索的法律概念解释方法,该方法首先将用户输入解析成为法律概念。其次,通过多视角聚类方法抽取具有多样性的相关法律案例,而后提取这些法律案例中涉及到的法律条文并在数据库上检索,并使用大语言模型检索生成用户查询可能涉及到的法律条文(即混合检索步骤)。之后,在法律概念数据库上检索解析概念的具体定义,并且搜索相关法律案例和法律条文中给出的关键词信息,将这些关键词作为相关概念并检索,将解析概念和关键词的集合作为总相关概念集合。最后,将相关概念和相关法条组织成为提示输入到大语言模型生成初始结果,接下来将生成结果和输入提示以及初始问题投入到大语言模型中进行反思,进而生成最终结果,并将法律案例附在生成结果后输出给用户查看。

    一种静默活体检测方法
    5.
    发明公开

    公开(公告)号:CN113609944A

    公开(公告)日:2021-11-05

    申请号:CN202110851342.4

    申请日:2021-07-27

    Applicant: 东南大学

    Abstract: 本发明公开一种静默活体检测方法,依次包括以下步骤:步骤1:将输入视频经过预处理操作得到固定大小的人脸图片;步骤2:将步骤1得到的固定大小人脸图像分别采取RGB和YCrCb色彩空间表示,接着输入进双流特征融合网络模型实现特征提取;步骤3:将非活体类别细分成打印攻击和展示攻击两个类别,根据步骤2得到的图像特征表示进行类别预测,采取多分类交叉熵损失监督模型训练,可以有效降低算法的分类错误率并提升泛化性能。本发明采取单帧图片输入、无需额外辅助设备,算法实现成本低廉,也无需进行额外的人机交互,具有良好用户体验。

    一种基于规则的医患纠纷案件关键词提取方法

    公开(公告)号:CN108345584A

    公开(公告)日:2018-07-31

    申请号:CN201810007166.4

    申请日:2018-01-04

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于规则的医患纠纷案件关键词提取方法,包括:(1)按照关键词类别建立医患纠纷关键词提取规则的生成模板;(2)按照标志词包含量将医患纠纷案件文书模块化;(3)对医患纠纷案件文书的各模块定义关键词集合,并从各模块中提取对应关键词集合中的关键词;(4)按照步骤(1)定义的生成模板,将步骤(3)提取的每个关键词编写为伪表达式,并自动化映射成机器可识别表达式;(5)判别提取的关键词是否正确,若正确则将关键词对应的机器可识别表达式以及所属文书和段落属性进行存储,若不正确则存入规则待完善集合中;(6)根据规则待完善集合调整完善提取规则。本发明提高了关键词提取的准确率和召回率。

    一种主机负荷智能感知的定向爬虫方法及系统

    公开(公告)号:CN111125488A

    公开(公告)日:2020-05-08

    申请号:CN201911353456.5

    申请日:2019-12-25

    Applicant: 东南大学

    Abstract: 本发明公开了一种主机负荷智能感知的定向爬虫方法及系统,方法包括:(1)打开浏览器并定位到待爬取站点,通过模拟浏览器行为实现页面的跳转以及读取;(2)根据设置的检索条件自动生成需要爬取页面的URL集合;(3)根据爬虫任务的重要性和紧迫程度对URL集合进行优先级分级,划分为若干个子集合,为每个子集合分配一个或多个线程来处理;(4)每个线程在进行数据爬取时所采用的方法为:A、对于URL中待爬取的条目,抓取相应内容的关键字词或标题,进行语义分析,并根据语义分析结果筛选爬取内容;B、记录当前页面响应时间,并与历史页面响应时间比较,从而感知主机/网络的繁忙程度,动态地调整爬取速度。本发明爬虫效率更高,且具有自律性,有利于构建良好的互联网生态。

    一种基于信息检索和大语言模型驱动的机器遗忘学习方法

    公开(公告)号:CN119848214A

    公开(公告)日:2025-04-18

    申请号:CN202510071938.0

    申请日:2025-01-16

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于信息检索和大语言模型驱动的机器遗忘学习方法,用于在法律领域中对知识丰富的大语言模型进行遗忘学习。对于给定的用户查询,重新定义了遗忘学习任务,采取不改动模型参数的方式,通过为模型添加禁止访问遗忘集的权限,从而使模型拒绝回答有关遗忘集的信息,达到遗忘学习目标。首先通过混合检索机制将用户查询在遗忘集语料中执行信息检索。然后基于本发明设计的重排序器,将检索出的段落按照相关性重新排序。接着将最相关的前n个段落输入到基于大语言模型的校验器中进行校验,进一步明确用户查询是否涉及遗忘集的信息。本发明方法在遗忘学习任务上具有较高的整体性能,能够在实现精准可靠的遗忘学习的同时,兼顾效率与成本。

Patent Agency Ranking