-
公开(公告)号:CN115828893B
公开(公告)日:2023-11-17
申请号:CN202211501006.8
申请日:2022-11-28
Applicant: 北京海致星图科技有限公司
IPC: G06F40/211 , G06F40/289 , G06F40/35
Abstract: 本发明提供一种非结构化文档问答的方法、装置、存储介质和设备,所述方法包括:创建文档索引库,对文档进行解析,获得段落索引、句对索引和全文索引,利用召回算法从段落索引中获得最相关段落并进行答案抽取,获得段落索引结果,对待回答问题和句对索引分别进行向量化处理并计算相似度得分,将相似度得分记录大于阈值的句对索引对应的标题及段落内容作为句对索引结果,将待回答问题去除停用词,利用召回算法从全文索引中检索,获得全文索引结果,最后将段落索引结果、句对索引结果和全文索引结果按照预设策略整合,得到答案和参考答案。本发明能够快速从文档中获得答案,或者定位与问题有相关度的文本内容,提升非结构化文档问答的速度与精度。
-
公开(公告)号:CN116126521B
公开(公告)日:2023-10-31
申请号:CN202211639798.5
申请日:2022-12-20
Applicant: 北京海致星图科技有限公司
IPC: G06F9/50
Abstract: 本发明实施例提供一种服务内存信息的负载均衡方法、装置、存储介质和设备,该方法包括:监控服务接收上游应用服务监控数据获取请求,监控服务根据监控数据获取请求,获取各应用服务的监控数据,当监控服务中存在监控数据时,读取监控数据并将监控数据发送至上游应用服务,当监控服务中不存在监控数据时,读取各应用服务当前的内存数据进行汇总,最后将监控数据返回至上游应用服务,以使上游应用服务根据监控数据选择目标应用服务进行调用。本发明能够进行分布式部署,实时监控各应用服务内存中的数据,根据各应用服务的内存情况进行负载均衡,从而保证各应用服务功能的效果一致,且对单个服务器的硬件要求不高,应用服务数量可扩展,支持高并发。
-
公开(公告)号:CN115828893A
公开(公告)日:2023-03-21
申请号:CN202211501006.8
申请日:2022-11-28
Applicant: 北京海致星图科技有限公司
IPC: G06F40/211 , G06F40/289 , G06F40/35
Abstract: 本发明提供一种非结构化文档问答的方法、装置、存储介质和设备,所述方法包括:创建文档索引库,对文档进行解析,获得段落索引、句对索引和全文索引,利用召回算法从段落索引中获得最相关段落并进行答案抽取,获得段落索引结果,对待回答问题和句对索引分别进行向量化处理并计算相似度得分,将相似度得分记录大于阈值的句对索引对应的标题及段落内容作为句对索引结果,将待回答问题去除停用词,利用召回算法从全文索引中检索,获得全文索引结果,最后将段落索引结果、句对索引结果和全文索引结果按照预设策略整合,得到答案和参考答案。本发明能够快速从文档中获得答案,或者定位与问题有相关度的文本内容,提升非结构化文档问答的速度与精度。
-
公开(公告)号:CN116401347A
公开(公告)日:2023-07-07
申请号:CN202310243919.2
申请日:2023-03-09
Applicant: 北京海致星图科技有限公司
IPC: G06F16/332 , G06F16/33
Abstract: 本发明提供了一种基于知识能力和机器人的灵活挂接方法,包括如下步骤:将机器人和其拥有的知识内容划分为机器人层、能力层、数据集层;在后台管理服务服务中划分为机器人管理模块、能力管理模块、知识管理模块;根据角色对后台管理人员授予不同功能模块的操作权限;将知识内容下沉至数据集层,构建系统的知识管理方式。本发明提供的基于知识能力和机器人的灵活挂接方法、设备和计算机可读存储介质,对机器人所拥有的知识内容进行分层分类处理,提供精细化数据权限控制,各层独立管理权限,在问答过程中明确答案来源,方便对问答效果进行分析优化,热更新机器人与能力和能力与数据的挂载关系,用于后续的问题分析。
-
公开(公告)号:CN116303923A
公开(公告)日:2023-06-23
申请号:CN202211625694.9
申请日:2022-12-16
Applicant: 北京海致星图科技有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06F16/31 , G06F16/36
Abstract: 本申请涉及知识图谱问答分析技术领域,特别是涉及一种知识图谱问答方法、装置、计算机设备和存储介质。一种知识图谱问答方法通过预先建立的词库对用户问句进行数据库对象信息提取,得到分词信息;通过预先建立的搜索知识库对分词信息进行实体识别,得到检索结果;通过预先建立的模板库对检索结果进行拒识、约束规整和方向判断中的至少一项处理,得到用户问句的答案结果;根据答案结果选择相应的查询模板,在知识图谱的查询服务中生成答案话术。本申请能在给定的构建完成的知识图谱上,通过对用户问题的理解,将用户问题转化为知识图谱上的查询语句,并执行该查询语句得到答案返回的过程。
-
公开(公告)号:CN116150394A
公开(公告)日:2023-05-23
申请号:CN202211640018.9
申请日:2022-12-20
Applicant: 北京海致星图科技有限公司
Abstract: 本发明实施例提供一种用于知识图谱的知识抽取方法、装置、存储介质和设备,该方法包括:构建领域知识同义词库,获得领域内非结构化文档数据,对非结构化文档数据和同义词库进行解析并进行相关处理,对解析后的非结构文档数据进行实体、关系和属性的可视化标注,获得标注的样本数据,利用标注的样本数据对预先设置的通用模型进行训练获得应用模型,根据业务要求可视化定义业务规则模型,利用业务规则模型和应用模型自动对所述实体、关系及属性进行抽取,将抽取的数据接入图数据库。本发明能够对非结构化文档进行标注及实现自动化知识抽取。
-
公开(公告)号:CN116401346A
公开(公告)日:2023-07-07
申请号:CN202310219903.8
申请日:2023-03-09
Applicant: 北京海致星图科技有限公司
IPC: G06F16/332 , G06F40/242
Abstract: 本发明提供了一种任务型多轮对话构建方法、设备和计算机可读存储介质,方法包括:通过意图管理,可配置在对话中需触发的任务型对话意图;意图管理步骤中,对话意图的配置具体包括:词槽设置,词槽设置用于定义在对话中需要抽取的各个槽位信息和抽取内容的范围,实现对话意图所需填充的信息;触发设置,触发设置用于定义触发对话意图的条件;回复设置,回复设置用于设置对话完成的条件和回复结果,可根据词槽情况配置触发最终回复的条件。本发明提供的任务型多轮对话构建方法、设备和计算机可读存储介质,满足多种实际应用场景的对话交互需求。
-
公开(公告)号:CN116401345A
公开(公告)日:2023-07-07
申请号:CN202310219193.9
申请日:2023-03-09
Applicant: 北京海致星图科技有限公司
IPC: G06F16/332 , G06N20/00
Abstract: 本发明实施例提供一种智能问答方法、装置、存储介质和设备,该方法包括:对多个文档数据进行预处理,获得无标注训练数据、文档段落集和文档片段集,利用无标注训练数据对预训练模型进行继续训练,针对待回答问题,使用召回算法对文档段落集和文档片段集进行粗召回,获得候选段落和候选片段,并对候选片段进行后处理,将待回答问题依次与每一条候选段落和后处理后的候选片段进行拼接,获得多条待预测数据,将多条待预测数据输入继续训练好的模型中,获取输入文本向量特征,将输入文本向量特征输入答案抽取层获得所述待回答问题对应的答案。本发明能够提高问答效率和准确率,且能够支持跨段落的待回答问题。
-
公开(公告)号:CN116126521A
公开(公告)日:2023-05-16
申请号:CN202211639798.5
申请日:2022-12-20
Applicant: 北京海致星图科技有限公司
IPC: G06F9/50
Abstract: 本发明实施例提供一种服务内存信息的负载均衡方法、装置、存储介质和设备,该方法包括:监控服务接收上游应用服务监控数据获取请求,监控服务根据监控数据获取请求,获取各应用服务的监控数据,当监控服务中存在监控数据时,读取监控数据并将监控数据发送至上游应用服务,当监控服务中不存在监控数据时,读取各应用服务当前的内存数据进行汇总,最后将监控数据返回至上游应用服务,以使上游应用服务根据监控数据选择目标应用服务进行调用。本发明能够进行分布式部署,实时监控各应用服务内存中的数据,根据各应用服务的内存情况进行负载均衡,从而保证各应用服务功能的效果一致,且对单个服务器的硬件要求不高,应用服务数量可扩展,支持高并发。
-
-
-
-
-
-
-
-