基于原子知识算子的大语言模型异构知识推理方法及装置

    公开(公告)号:CN119670883A

    公开(公告)日:2025-03-21

    申请号:CN202411635486.6

    申请日:2024-11-15

    Applicant: 清华大学

    Abstract: 本发明提供一种基于原子知识算子的大语言模型异构知识推理方法及装置,其中的方法包括:基于原始待解答问题,构建原子推理树;其中,原子推理树包括父节点和叶节点,父节点中的根节点为原始待解答问题,父节点中的非根节点为由原始待解答问题分解得到的不同层级子问题,叶节点为由原始待解答问题分解得到的原子问题,每一叶节点对应一个原子知识算子,原子知识算子包括搜索算子、关系算子以及过滤算子;对于叶节点,基于大语言模型和原子知识算子,根据检索‑知识对原子问题进行推理;对于父节点,基于大语言模型,根据子节点推理答案、兄弟节点推理答案或检索‑知识对子问题进行推理;对原子推理树从叶节点到根节点自下而上进行推理,得到原始待解答问题的推理结果;其中,检索‑知识通过从多种异构知识源执行动态知识检索得到。该方法通过将原始待解答问题分解到原子级别的细粒度,并使原子推理树中的叶节点对应一个原子知识算子,实现了更精确的推理结果,与此同时,通过在每个子问题和原子问题节点允许从多种异构知识源动态检索知识,能够灵活应对不同类型的查询,提供了更丰富、准确和互补的信息,增强了算法的整体推理能力。

    大语言模型的训练方法、装置、电子设备及存储介质

    公开(公告)号:CN119647586A

    公开(公告)日:2025-03-18

    申请号:CN202411522546.3

    申请日:2024-10-29

    Applicant: 清华大学

    Abstract: 本发明提供一种大语言模型的训练方法、装置、电子设备及存储介质,涉及人工智能技术领域。其中,大语言模型的训练方法,包括:获取指令响应数据对;其中,指令响应数据对由指令和利用大语言模型根据指令生成的响应组成,响应包括预设领域的文本;从指令响应数据对包含的响应中,提取响应包含的约束信息;根据响应、响应包含的约束信息以及响应对应的指令,生成训练数据集;利用训练数据集,对预训练的大语言模型进行继续训练,得到目标大语言模型,以利用目标大语言模型根据指令,生成响应。本发明可以高效地训练得到可准确执行具有复杂约束的指令的大语言模型,进而有效提升计算资源的利用率。

    一种旅游知识语义分析方法及装置

    公开(公告)号:CN114036956B

    公开(公告)日:2024-12-03

    申请号:CN202111371152.9

    申请日:2021-11-18

    Applicant: 清华大学

    Abstract: 本发明提供一种旅游知识语义分析方法及装置。其中,该方法包括:获取待理解旅游知识文本;将所述待理解旅游知识文本输入至基于异构旅游知识的预训练语言模型中,得到所述预训练语言模型输出的语义理解结果;其中,所述预训练语言模型是以预设的非结构化文本、半结构化文本和满足结构条件的预设知识三元组文本为训练样本,并基于相应的无监督训练任务将所述训练样本统一建模到相同的上下文表示空间中得到的。本发明提供的旅游知识语义分析方法,能够通过利用多种格式文本训练得到的基于异构旅游知识的预训练语言模型对不同粒度的旅游知识文本进行分析,以提高旅游知识文本语义理解的准确度和鲁棒性,从而提升用户的使用体验。

    知识图谱构建的方法和装置

    公开(公告)号:CN113268606B

    公开(公告)日:2024-10-29

    申请号:CN202110586725.3

    申请日:2021-05-27

    Applicant: 清华大学

    Abstract: 本发明提供一种知识图谱构建方法和装置,方法包括获取原始数据和大规模知识图谱;对所述原始数据进行知识建模,得到知识建模结果;基于所述知识建模结果和所述大规模知识图谱,生成概念层数据;对所述原始数据进行知识获取,其中包括实体抽取、实体分类以及第一实体属性抽取,得到实体、实体类别以及实体属性;将所述实体作为关键词输入所述大规模知识图谱,获取所述实体的实体相关信息;将所述实体、所述实体类别、所述实体属性、所述实体相关信息进行融合,得到完整的实体层数据;基于所述概念层数据与所述实体层数据建构新的知识图谱。本发明通过上述方法实现对知识图谱构建,同时也能够利用上述步骤实现对知识图谱使用过程中的更新。

    一种针对信息抽取任务的大语言模型对齐方法及系统

    公开(公告)号:CN118427292A

    公开(公告)日:2024-08-02

    申请号:CN202410531939.4

    申请日:2024-04-29

    Applicant: 清华大学

    Abstract: 本发明提供一种针对信息抽取任务的大语言模型对齐方法及系统,该方法包括:确定信息抽取指导调整数据集;信息抽取指导调整数据集包括多样化的输入和答案输出;多样化的输入基于预设信息抽取数据在信息抽取任务上对齐大语言模型;答案输出与多样化的输入的格式要求对应;基于信息抽取指导调整数据集和预设通用对齐语料库对预设大语言模型进行监督微调训练,得到监督微调大语言模型。本发明为信息抽取任务确定了高质量的对齐数据,并基于对齐数据对预设大语言模型进行监督微调训练,使监督微调大语言模型在信息抽取任务上具有较好的泛化能力,且不影响大语言模型的通用性能。

    概念抽取方法、装置、电子设备及存储介质

    公开(公告)号:CN112527977B

    公开(公告)日:2024-06-25

    申请号:CN202011241251.0

    申请日:2020-11-09

    Applicant: 清华大学

    Abstract: 本发明实施例提供一种概念抽取方法、装置、电子设备及存储介质,其中,该方法包括:根据预设的词表对待提取文本进行术语抽取,获取第一候选概念列表,并根据预设的知识图谱对待提取文本进行实体链接,获取第二候选概念列表;对第一候选概念列表和第二候选概念列表中的各候选概念进行重排序,根据重排序的结果获取待提取文本的概念抽取结果;其中,待提取文本为非结构化文本。本发明实施例提供的概念抽取方法、装置、电子设备及存储介质,通过对待提取文本进行术语抽取和实体链接获取的各候选概念进行重排序,根据重排序的结果获取概念抽取结果,能在标注数据较少甚至没有标注数据的情况下,从非结构化文本中更高效、准确等抽取出概念。

    知识密集型推理问答方法、装置、电子设备和存储介质

    公开(公告)号:CN117634617B

    公开(公告)日:2024-05-17

    申请号:CN202410102332.4

    申请日:2024-01-25

    Applicant: 清华大学

    Abstract: 本发明涉及计算机领域,提供一种知识密集型推理问答方法、装置、电子设备和存储介质,方法包括:确定推理目标问题所需的步骤集合,步骤集合包括对应各步骤的知识操作原语;针对步骤集合中的各步骤,顺序进行原语执行,在此过程中,基于任一步骤对应的知识操作原语的各种执行方式、以及各种执行方式在数据管理器中关联的知识,确定该步骤对应的知识操作原语的目标执行方式,并基于目标执行方式、以及目标执行方式在数据管理器中关联的知识,执行该步骤对应的知识操作原语;基于步骤集合中步骤进行原语执行的结果,确定目标问题对应的答案。本发明提供的方法、装置、电子设备和存储介质,将符号逻辑与神经计算进行结合,确保问答实现的可靠性。

    知识密集型推理问答方法、装置、电子设备和存储介质

    公开(公告)号:CN117634617A

    公开(公告)日:2024-03-01

    申请号:CN202410102332.4

    申请日:2024-01-25

    Applicant: 清华大学

    Abstract: 本发明涉及计算机领域,提供一种知识密集型推理问答方法、装置、电子设备和存储介质,方法包括:确定推理目标问题所需的步骤集合,步骤集合包括对应各步骤的知识操作原语;针对步骤集合中的各步骤,顺序进行原语执行,在此过程中,基于任一步骤对应的知识操作原语的各种执行方式、以及各种执行方式在数据管理器中关联的知识,确定该步骤对应的知识操作原语的目标执行方式,并基于目标执行方式、以及目标执行方式在数据管理器中关联的知识,执行该步骤对应的知识操作原语;基于步骤集合中步骤进行原语执行的结果,确定目标问题对应的答案。本发明提供的方法、装置、电子设备和存储介质,将符号逻辑与神经计算进行结合,确保问答实现的可靠性。

    一种阅读理解数据集生成方法及组件

    公开(公告)号:CN116975222A

    公开(公告)日:2023-10-31

    申请号:CN202310723628.3

    申请日:2023-06-16

    Applicant: 清华大学

    Abstract: 本发明提供一种阅读理解数据集生成方法及组件,该方法包括:构建阅读理解的知识文档;知识文档包括阅读材料文本、背景知识库和阅读材料文本与背景知识库的实体对齐关系;根据知识文档进行推理链抽取,得到推理链和问题三元组;根据推理链和问题三元组进行数据生成,得到自然语言问题和自然语言问题对应的答案,从而得到高质量的数据库,语言智能系统根据数据库进行深度语义理解推理出问题的答案的效率和精准性更高。

    事件检测模型的解释方法、装置、电子设备及存储介质

    公开(公告)号:CN116862002A

    公开(公告)日:2023-10-10

    申请号:CN202310705109.4

    申请日:2023-06-14

    Applicant: 清华大学

    Abstract: 本发明提供一种事件检测模型的解释方法、装置、电子设备及存储介质,其中的方法包括:基于待检测语句和预先训练的事件检测模型,抽取待解释的隐层表示;优化待解释的隐层表示,得到优化隐层表示;根据优化隐层表示,以及给定的事件结构信息集合,获取目标事件结构信息;其中,目标事件结构信息为与优化隐层表示最相关的事件触发词或事件论元。该方法通过将事件结构信息自然地融入至事件检测模型的解释过程中,克服了现有事件检测模型解释方法因忽略事件本身具有的结构信息,导致事件检测模型的可解释性能力不高的缺陷,有效提升了事件检测模型的可解释性能力,亦有助于理解事件检测模型的决策过程。

Patent Agency Ranking