-
公开(公告)号:CN117035077A
公开(公告)日:2023-11-10
申请号:CN202310978822.6
申请日:2023-08-04
Applicant: 东南大学
Abstract: 本发明公开了一种基于软模板和反事实推理的难度可控问题生成方法,主要用于根据指定的难度标签有效地生成相应难度水平的问题。本发明对于给定的子图,首先设计一个启发式模板将其中的三元组转化为自然语言表达,并将子图的实体和关系的本体信息填入模板中强化输入。然后提出一种难度评估方法,使用该方法将数据集中的问题划分成简单和复杂两个类别。接着利用预训练语言模型,在不同难度等级的数据集上初始化软模版,用于指导问题生成,确保问题的语法正确性和难度匹配性。并使用混合专家模型选择软模版,以平衡对生成问题的难度控制需求和多样化。最后基于反事实推理生成问题,强化输入和输出之间的因果关联。
-
公开(公告)号:CN116975234A
公开(公告)日:2023-10-31
申请号:CN202310951461.6
申请日:2023-07-31
Applicant: 东南大学
IPC: G06F16/332 , G06F16/36 , G06N5/02
Abstract: 本发明公开了一种基于模块化对偶学习的知识图谱问答和问题生成方法,主要用于将知识图谱问答任务和问题生成任务联合学习,提高彼此的性能。本发明对于特定任务的给定输入,首先通过一个离散的隐变量以混合专家的方式产生一个路由选择器。然后通过路由选择器和给定的上下文生成一个适应当前任务的共享网络结构,这些共享的神经网络层具有相同的结构和参数量,在组成新的网络结构时,可以被放在串联路径上的不同位置,而且可以被重复使用。最后,提出一种衡量共享网络是否需要纳入当前任务计算过程的评估方法,自适应引入对偶任务的归纳偏置来改善当前模型,提高模型的性能。
-
公开(公告)号:CN115759042A
公开(公告)日:2023-03-07
申请号:CN202211218782.7
申请日:2022-10-07
Applicant: 东南大学
IPC: G06F40/211 , G06F40/146 , G06F18/24 , G06F18/25 , G06N3/0442 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于句法感知提示学习的句子级问题生成方法,本发明首先根据给定的句子,构建相应的双向句法依存图,通过基于关系感知的注意力图编码器获取其语义表示,并将编码后的向量的输入softmax层,根据概率选取前k个向量作为连续型prompt。以前缀调整的方式将prompt拼接在给定源文本和答案上,共同输入到BERT模型中编码。然后将编码结果送入Transformer模型解码,并且在解码的每个时间步,建模已生成文本序列的句法依存信息,结合该信息和源句子的句法依存信息共同决定解码器需要重点关注的部分,辅助当前词的生成。同时,引入了复制机制来解决生成的单词不在问题词汇表中的情况,使得模型可以直接从源文本中复制单词。
-
公开(公告)号:CN115048510A
公开(公告)日:2022-09-13
申请号:CN202210147755.9
申请日:2022-02-17
Applicant: 东南大学
IPC: G06F16/35 , G06F16/36 , G06F16/31 , G06F40/30 , G06F40/211 , G06F40/268 , G06F40/289 , G06N5/02 , G06Q10/04 , G06Q50/18
Abstract: 本发明涉及一种基于层级式法律知识与双图联合表示学习的罪名预测方法,主要用于依据案件事实描述对被告自动进行罪名预测,尤其是易混淆罪名的预测,辅助法官判案。本发明首先利用爬虫技术从中国裁判文书网上爬取大量法律文书,并对裁判文书进行初步处理,提取出每份文书的事实描述部分以及对应的判决罪名,构建结构图和语义图,并使用联合图交互得到事实描述的语义表示向量。然后利用爬虫技术爬取所有罪名的构成要件,作为专业法律知识用以区分罪名,并使用双图联合表示学习得到每个罪名知识的语义表示向量。然后利用注意力机制,得到知识感知的事实描述语义向量,最后将其与原事实向量相结合,输入到softmax层得到该事实描述对应的罪名预测结果。
-
公开(公告)号:CN112100321A
公开(公告)日:2020-12-18
申请号:CN202010760699.7
申请日:2020-07-31
Applicant: 东南大学
IPC: G06F16/33 , G06F40/295 , G06Q50/18
Abstract: 一种基于网络表示学习的相似案例推荐方法,主要用于给定法律文书的情况下在庞大的法律文书数据库中找出该法律文书最相似的10篇法律文书。本发明以互联网上的法律文书作为起点,利用爬虫技术爬取大量的法律文书,利用正则表达式对法律文书进行初步处理;利用爬虫技术爬取大量的法律实体,并通过bert计算法律实体与法律实体之间的相似度,达到阈值的法律实体之间构建相似实体关系,利用法律实体和法律文书构建法律知识网络,并将构建完成的网络输入到网络表示学习模型中,得到法律文书的向量值,利用余弦相似度计算得到该法律文书最相似的10篇文书。
-
公开(公告)号:CN119783818A
公开(公告)日:2025-04-08
申请号:CN202411843860.1
申请日:2024-12-14
Applicant: 东南大学
IPC: G06N5/04 , G06N5/022 , G06F16/3329 , G06F16/36
Abstract: 本发明公开了一种基于知识图谱和大语言模型的后续问题生成方法,主要用于在对话系统中生成后续问题,帮助用户探索信息并提供更好的用户体验。本发明对于给定的历史问答信息,首先进行意图识别,扩展相关背景知识,从对话中提取关键词,并构造查询以检索最相关的维基百科页面。接下来,本发明以页面对应的实体为中心构建实时知识图谱。然后,基于节点重要性和相关度两个维度选出与当前对话最相关的节点,从而确定需要引入的外部背景知识。这使得模型可以访问更广泛的知识资源,提高所生成问题的深度和相关度。最后,本发明设计了一个知识融合操作,通过指示大语言模型基于上下文继续编写先前获取的外部维基百科知识,进一步增强模型对上下文的理解和认知,指导后续问题生成。一系列实验表明,本发明方法在后续问题生成任务上具有较高的整体性能,可以生成信息更丰富、认知复杂度更高的问题,并有助于将对话推向更深层次。
-
公开(公告)号:CN115048510B
公开(公告)日:2024-07-23
申请号:CN202210147755.9
申请日:2022-02-17
Applicant: 东南大学
IPC: G06F16/35 , G06F16/36 , G06F16/31 , G06F40/30 , G06F40/211 , G06F40/268 , G06F40/289 , G06N5/022 , G06N5/02 , G06Q10/04 , G06Q50/18
Abstract: 本发明涉及一种基于层级式法律知识与双图联合表示学习的罪名预测方法,主要用于依据案件事实描述对被告自动进行罪名预测,尤其是易混淆罪名的预测,辅助法官判案。本发明首先利用爬虫技术从中国裁判文书网上爬取大量法律文书,并对裁判文书进行初步处理,提取出每份文书的事实描述部分以及对应的判决罪名,构建结构图和语义图,并使用联合图交互得到事实描述的语义表示向量。然后利用爬虫技术爬取所有罪名的构成要件,作为专业法律知识用以区分罪名,并使用双图联合表示学习得到每个罪名知识的语义表示向量。然后利用注意力机制,得到知识感知的事实描述语义向量,最后将其与原事实向量相结合,输入到softmax层得到该事实描述对应的罪名预测结果。
-
公开(公告)号:CN110879842A
公开(公告)日:2020-03-13
申请号:CN201910980158.2
申请日:2019-10-15
Applicant: 东南大学
IPC: G06F16/36 , G06F16/9535 , G06F40/295 , G06F40/30
Abstract: 本发明涉及一种基于信息抽取的法律知识图谱构建方法,所述方法包括以下步骤:步骤1)从网络中爬取大量法律文书和法律实体;步骤2)从百度百科中抽取和法律相关的法律实体;步骤3)融合爬取得到的法律实体和百度百科中抽取得到的法律实体,并将法律实体链接至法律文书,构建法律实体与法律文书之间的网络;步骤4)利用实体描述和实体名称构建实体网络,基于实体结构信息构建实体相似度网络。步骤5)抽取法律文书中的三元组,结合法律实体构建法律知识图谱。
-
公开(公告)号:CN113127623B
公开(公告)日:2024-11-19
申请号:CN202110490812.9
申请日:2021-05-06
Applicant: 东南大学
IPC: G06F16/332 , G06F16/33 , G06F16/36 , G06N3/0464 , G06N3/047 , G06N3/08
Abstract: 本发明公开了一种基于混合专家模型和联合学习的知识库问题生成方法,主要用于给定知识图谱三元组子图、答案和复杂关系信息的情况下生成与给定三元组子图相关的,可被答案回答的,并且对应给定关系信息的、多样化的复杂自然语言表述问题。本发明使用图神经网络对输入三元组子图进行编码,得到输入子图的向量表示。使用Transformer网络进行解码,生成问题。在解码过程中结合复杂问题场景,使用隐变量建模有效表示关系的结构信息。此外使用混合专家模型,指导问题生成,提升生成问题的多样性。最后使用知识图谱问答任务与知识图谱问题生成任务联合训练,用于约束问题生成过程,使生成的问题包含期望的复杂关系信息,实现生成复杂问题的目的。
-
公开(公告)号:CN110889502B
公开(公告)日:2024-02-06
申请号:CN201910980161.4
申请日:2019-10-15
Applicant: 东南大学
IPC: G06Q50/18 , G06F40/289 , G06F18/214 , G06N3/0442 , G06N3/08 , G06F16/9032
Abstract: 本发明涉及一种基于深度学习的争议焦点生成方法,所述方法包括以下步骤:步骤1)从网络中爬取大量裁判文书;步骤2)利用正则表达式方法对裁判文书进行初步的清洗和整理,抽取出裁判文书中的原告诉称和被告辩称,并对每一对原告诉称和被告辩称进行人工标注,将原告诉称和被告辩称以及人工标注的数据集,以1:1:1的比例构建成训练集;步骤3)使用深度学习中的seq2seq文本生成模型和attention模型对所述步骤2)最终得到的训练数据集进行训练后,导出该训练数据集对应的生成器模型;步骤4)对步骤3)中训练得到的文本生成器,利用训练完成的生成器从未标注的原告诉称和被告辩称中生成双方的争议焦点。
-
-
-
-
-
-
-
-
-