一种基于多类文本表征的知识分类树融合方法及计算机可读存储介质

    公开(公告)号:CN118708721A

    公开(公告)日:2024-09-27

    申请号:CN202410116679.4

    申请日:2024-07-05

    Abstract: 本发明提供一种基于多类文本表征的知识分类树融合方法及计算机可读存储介质,包括:获取知识体系进行知识表示,获得知识分类树;基于所述知识分类树进行文本向量化表征,获得知识向量;基于所述知识向量,进行知识融合;基于所述知识融合,进行知识存储;基于所述知识存储,进行知识可视化。跨知识体系的融合的方法大多是基于规则,对于复杂的知识结点表示效果不佳。知识分类树只能表示上下位关系,无法提供丰富的语义信息。针对上述问题,本发明提出了一种基于多类文本表征的知识分类树融合方法及计算机可读存储介质,使得整个知识分类树融合流程完备,自动化程度高,可信性强,还兼具了知识体系树可视化的功能,能够更清晰地浏览整个知识体系。

    对话引导信息的生成及问答方法、系统、智能对话机器人

    公开(公告)号:CN117610510B

    公开(公告)日:2024-09-03

    申请号:CN202311629235.2

    申请日:2023-11-30

    Inventor: 马任 李帅帅

    Abstract: 本公开提供了一种对话引导信息的生成及问答方法、系统、智能对话机器人,该对话引导信息的生成方法包括:基于预设数据集筛选获得若干个目标对话案例,每个目标对话案例对应一个对话主题,且若干个所述目标对话案例对应的所述对话主题相同,对若干个所述目标对话案例进行案例标准化处理,得到若干个标准对话案例,基于预设规则对若干个所述标准对话案例进行拼接,生成所述对话引导信息,其中,所述对话引导信息用于激发大语言模型的逻辑推理能力,帮助大语言模型生成有逻辑的、情感统一的对话回复,可控性高、体验性好。

    一种用于增强检索效果的法律文本多标签生成方法及装置

    公开(公告)号:CN117909519A

    公开(公告)日:2024-04-19

    申请号:CN202410092818.4

    申请日:2024-01-23

    Abstract: 本发明提供一种用于增强检索效果的法律文本多标签生成方法及装置,其中方法包括:获取法律文本和法律问题,构建用于训练的数据集;对所述数据集进行预处理,得到法律文本标签和法律问题数据;基于所述法律文本标签和法律问题数据,训练得到多标签分类模型;基于所述多标签分类模型,构建知识库检索模型;将所述知识库检索模型整合到RAG框架中,得到RAG框架下的法律文本多标签生成模型;对所述法律文本多标签生成模型进行评估和优化。本发明减少了因法典数量庞大带来的检索噪音,优化了法律信息检索的各个环节,显著提升了法律信息检索系统检索的精确度和效率,减少了计算资源的消耗。

    预训练模型调整方法及装置、存储介质、计算设备

    公开(公告)号:CN116881641A

    公开(公告)日:2023-10-13

    申请号:CN202310855991.0

    申请日:2023-07-12

    Abstract: 本申请提供了一种预训练模型调整方法及装置、存储介质、计算设备,该预训练模型调整方法包括:获取初始样本,初始样本包括多个问答对,并计算每一问答对对应的句子嵌入,每一问答对包括问题和答案;利用各个问答对对应的句子嵌入对各个问答对进行聚类,以得到多个簇,每个簇包括多个点,每一点对应一个句子嵌入;在每个簇中按照与同一簇中其他点的最大距离选取多个点,以得到核心样本;利用核心样本对预训练模型进行训练调整。本申请能够在保证模型训练的效果的基础上,避免预训练模型对原有知识的遗忘,提升预训练模型的性能。

    文档处理方法及装置、存储介质、终端、计算机程序产品

    公开(公告)号:CN118313352B

    公开(公告)日:2025-02-11

    申请号:CN202410373087.0

    申请日:2024-03-28

    Abstract: 一种文档处理方法及装置、存储介质、终端、计算机程序产品,方法包括:确定待处理文档;对待处理文档的每个页面进行解析,以确定内容列表和目录列表,内容列表包含多条段落项,每条段落项包含单个段落,目录列表包含多条标题项,每条标题项包含单个标题;基于目录列表构建目录树;逐层遍历目录树,对遍历的当前节点指示的标题及其同层相邻节点指示的标题,分别与内容列表中的至少一部分段落进行文本匹配,以确定相匹配的两个段落,然后对内容列表中位于相匹配的两个段落之间的所有段落进行拼接,将拼接结果作为当前节点的关联文本块。采用上述方案,可以对文档精准划分文本块并与各标题建立关联关系,以获得树形结构文档。

    文本转结构化查询语言的语句生成方法、系统、设备

    公开(公告)号:CN118820285A

    公开(公告)日:2024-10-22

    申请号:CN202410835072.1

    申请日:2024-06-26

    Abstract: 本公开提供了一种文本转结构化查询语言的语句生成方法、系统、设备,该语句生成方法包括:基于目标查询问题,确定目标查询语句中的数据关键词;基于目标查询问题,得到初始查询语句;基于初始查询语句和数据关键词,生成目标查询语句。本公开根据目标查询问题确定目标查询语句中的数据关键词,数据关键词包括与目标查询问题对应的表名、字段名和字段值中的至少一种;根据目标查询问题得到初始查询语句,初始查询语句为带有占位符和语法结构关键词的查询语句,占位符用于代替所述数据关键词;进而根据初始查询语句和数据关键词,生成目标查询语句,克服了通过模型生成相关列名时容易发生错误的问题,提升了生成的目标查询语句的准确率。

    文档处理方法及装置、存储介质、终端、计算机程序产品

    公开(公告)号:CN118313352A

    公开(公告)日:2024-07-09

    申请号:CN202410373087.0

    申请日:2024-03-28

    Abstract: 一种文档处理方法及装置、存储介质、终端、计算机程序产品,方法包括:确定待处理文档;对待处理文档的每个页面进行解析,以确定内容列表和目录列表,内容列表包含多条段落项,每条段落项包含单个段落,目录列表包含多条标题项,每条标题项包含单个标题;基于目录列表构建目录树;逐层遍历目录树,对遍历的当前节点指示的标题及其同层相邻节点指示的标题,分别与内容列表中的至少一部分段落进行文本匹配,以确定相匹配的两个段落,然后对内容列表中位于相匹配的两个段落之间的所有段落进行拼接,将拼接结果作为当前节点的关联文本块。采用上述方案,可以对文档精准划分文本块并与各标题建立关联关系,以获得树形结构文档。

    短文本分类方法及装置、存储介质、计算设备

    公开(公告)号:CN118277846A

    公开(公告)日:2024-07-02

    申请号:CN202410205775.6

    申请日:2024-02-23

    Abstract: 本申请提供了一种短文本分类方法及装置、存储介质、计算设备,该短文本分类方法包括:获取待分类短文本以及体系化标签;计算待分类短文本与体系化标签中各个标签的语义相似度,并根据语义相似度获得与待分类短文本语义最接近的顶层标签候选集以及分类标签候选集;根据顶层标签候选集构建针对顶层标签的第一提示词,并将待分类短文本、第一提示词以及顶层标签候选集输入至大语言模型;根据分类标签候选集以及顶层标签分类结果构建针对分类标签的第二提示词,并将待分类短文本、第二提示词以及分类标签候选集输入至大语言模型,以输出分类结果。本申请提供了一种提升短文本分类准确性的方案。

Patent Agency Ranking