-
公开(公告)号:CN119988539A
公开(公告)日:2025-05-13
申请号:CN202411860394.8
申请日:2024-12-17
Applicant: 航天信息股份有限公司
IPC: G06F16/3329 , G06F16/334 , G06F16/35 , G06F16/953 , G06F16/951 , G06N5/022
Abstract: 本发明提供一种基于知识点扩充的领域知识库构建方法及装置,所述方法包括根据初始query集合中的每个种子query进行搜索,生成初始知识点数据;基于自定义的二分类模型,对所述初始知识点数据进行分类,滤除与拟构建领域知识库所在的专业领域不相关的知识点数据;根据所述有效知识点数据和自定义的知识库构建收敛条件,确定知识库构建结果,当所述构建结果为继续构建时,基于所述有效知识点数据对所述初始query集合进行扩展和聚类,生成更新后的query集合,并令更新后的query集合为初始query集合后进行重复迭代。所述方法和装置通过采用query搜索和扩充聚类,知识点数据分类模型以及与搜索引擎资源相结合的方式,提高了知识库的覆盖率和更新效率。
-
公开(公告)号:CN119964184A
公开(公告)日:2025-05-09
申请号:CN202411980143.3
申请日:2024-12-31
Applicant: 航天信息股份有限公司
IPC: G06V30/413 , G06V30/416 , G06V30/148
Abstract: 本发明提供一种基于轻量化模型的文档数据处理系统和方法,包括:文档转换模块,用于将待处理的文档转换为图片文件;版面分析模块,用于根据预先构建的版面分析轻量化模型,对所述图片文件进行处理,提取所述图片文件中的每个标签的类别和区域坐标;版面还原模块,用于根据每个标签的类别和区域坐标,对不同类别的标签区域分别进行解析处理,获得每个标签区域对应的内容;通过将每个标签区域对应的内容组合,获得待处理的文档的全部内容;文本切分模块,用于通过分割器将所述待处理的文档的全部内容,切分成预设大小的文本块,完成所述待处理的文档的格式转化和文档数据处理。实现了PDF格式文档中图形、表格及文字的快速识别及分离。
-
公开(公告)号:CN119962613A
公开(公告)日:2025-05-09
申请号:CN202411969238.5
申请日:2024-12-30
Applicant: 航天信息股份有限公司
IPC: G06N3/092 , G06N3/091 , G06F16/3329 , G06Q40/12
Abstract: 本发明公开了一种基于优化财税大模型飞轮进行需求响应的方法及系统,其中方法包括:实时采集财税服务系统中用户查询数据的真实查询prompt;基于奖励学习策略,对财务大模型响应所述真实查询prompt的结果进行学习奖励训练;基于优化策略,对经过学习奖励训练的所述财务大模型进行优化训练;对经过优化训练的所述财务大模型进行评估,将达到预期性能的所述财务大模型作为部署的最终财务大模型,通过所述最终财务大模型响应真实查询prompt。
-
公开(公告)号:CN114329362B
公开(公告)日:2025-03-04
申请号:CN202111557813.7
申请日:2021-12-16
Applicant: 航天信息股份有限公司 , 河北航天信息技术有限公司
Abstract: 本申请公开了基于容器的Python代码的保护方法、装置、设备和介质,涉及程序语言编译技术领域。所述方法,包括:创建用于生成和运行Python程序的容器环境,所述容器环境中配置有Python语言的源码集和依赖文件;获取所述源码集在当前所述容器环境中对应的随机操作码,所述随机操作码由所述源码集根据随机数序列进行随机乱序得到,所述随机数序列由当前所述容器环境确定;获取记载目标Python程序的工程源码,利用所述随机操作码对所述工程源码进行编译,得到向用户发布的目标字节码,实现了对Python程序内容的保护。
-
公开(公告)号:CN114491015B
公开(公告)日:2025-01-14
申请号:CN202111549731.8
申请日:2021-12-17
Applicant: 航天信息股份有限公司
IPC: G06F16/35 , G06F18/214 , G06F18/24
Abstract: 本发明实施例公开了一种文本分类模型增量训练与持续部署的方法和系统,所述方法包括:据用户输入的待分类文本数据生成反馈数据;根据选择的模型训练方式,基于待分类文本数据、反馈数据和导入的标注数据更新全量训练数据集、增量训练数据集和测试数据集;基于上述数据集,根据预先设置的模型训练规则,生成多个第一文本分类模型;根据预先设置的模型部署触发条件,从多个第一文本分类模型中选择满足模型部署触发条件的第一文本分类模型作为用于服务部署的第二文本分类模型。所述方法和系统降低了人工标注数据的成本,保证了根据持续更新的训练数据得到的文本分类模型能适应不断变化的业务场景的需求,简化了运维人员操作,提高了运维效率。
-
公开(公告)号:CN114036000B
公开(公告)日:2024-08-09
申请号:CN202111215236.3
申请日:2021-10-19
Applicant: 航天信息股份有限公司
Abstract: 本发明公开了一种适用于PostgreSQL主备环境的文件备份及清理方法及系统,属于文件处理技术领域。本发明方法,包括:登录PostgreSQL的主备环境,在所述主备环境中定时执行Shell脚本;使用PostgreSQL的pg_controldata命令,对历史WAL归档文件进行备份,并在备份完成后进行清理;针对PostgreSQL的备环境,计算磁盘的可存储WAL归档文件的支撑天数,根据所述支撑天数确定安全阈值天数,并将超出安全阈值天数的WAL归档文件进行清理。本发明的方法通过PostgreSQL原生pg_archivecleanup等命令,针对主备两种环境所承担工作的特点,分别实现了WAL文件的备份、清理和彻底清除等相关功能。
-
公开(公告)号:CN118037210A
公开(公告)日:2024-05-14
申请号:CN202311821539.9
申请日:2023-12-27
Applicant: 航天信息股份有限公司
Abstract: 本发明公开了一种多层级填报数据汇总审批的方法及系统。其中,该方法包括:基于用户信息,生成填报任务和填报任务组,确定填报表单;根据系统部门用户的结构树在已有结构树上进行新增、上下级调整更改名称形成报表户;基于所述填报任务和填报任务组,增加需要进行填报或汇总的系统用户;对所述增加的系统用户指定报表户中的填报会汇总权限;当确定好填报表单和填报汇总权限后,进行任务提交审核,相关部门领导人员审核无误后进行填报任务的发布,发布后具有权限的人员可进行填报、汇总计算。从而,增加预置汇总方案和自定义汇总方案方式保存各层级的汇总数据,对于各层级的汇总数据,汇总户可以直接将汇总数据继续上报直至最高层级。
-
公开(公告)号:CN117763097A
公开(公告)日:2024-03-26
申请号:CN202311253993.9
申请日:2023-09-26
Applicant: 航天信息股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/335
Abstract: 本申请公开一种问题问答方法、装置、电子设备和计算机存储介质,该方法包括:接收用户输入的问题信息;确定与问题信息相关的财税政策信息,并将财税政策信息插入到问题信息中,获得扩充问题信息;将扩充问题信息输入预先训练的问题回答模型,获得问题回答模型输出的回答内容;对回答内容进行解析,获得回答信息,并回答信息反馈给用户。本申请通过将与问题信息相关的财税政策信息插入到问题信息中,能够在用户输入的问题信息口语化,或者文本不规范的情况下,对问题信息进行完善,以更精确地生成回答内容,进而使用户能够精准找到所需求的财税政策。
-
公开(公告)号:CN117610517A
公开(公告)日:2024-02-27
申请号:CN202311638848.2
申请日:2023-12-01
Applicant: 航天信息股份有限公司
IPC: G06F40/174 , G06F40/18 , G06F40/106
Abstract: 本申请提供一种自由表单信息汇总方法、装置及相关设备,定义多种用于进行信息填写的表单文本框组件,用于支持对不同属性的表单信息进行录入,根据用户对表单文本框组件的操作,生成进行目标信息汇总的自由表单文件;对自由表单文件中包含的文本框进行用户关联,生成关联表单,以使关联表单中的文本框支持拥有不同权限的用户进行信息填写或信息管理工作,记录不同权限的用户在关联表单中各文本框中填报的信息,获取记录结果,根据记录结果,进行信息汇总。本申请提供丰富文本框组件生成自由表单,便于用户根据工作场景需求快速地创建表单,并基于关联用户的权限进行信息填报后生成记录结果,根据记录结果高效地实现对填报信息的汇总。
-
公开(公告)号:CN117391420A
公开(公告)日:2024-01-12
申请号:CN202311412224.9
申请日:2023-10-27
Applicant: 航天信息股份有限公司
IPC: G06Q10/0633 , G06F18/25 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本申请实施例提供了一种业务引导方法、装置、电子设备及存储介质,该业务引导方法,包括:获取视觉信息、文本信息和语音信息;对所述视觉信息、文本信息和语音信息进行处理,获得所述视觉信息、文本信息和所述语音信息对应的至少三个嵌入向量;通过预先训练的模态融合编码模型对所述至少三个嵌入向量进行组合,获得嵌入矩阵;通过预先训练的任务引导模型,根据所述嵌入矩阵确定业务引导流程,并根据所述业务引导流程进行业务引导。通过本申请实施例提供的业务引导方法可以避免通过人工编写脚本进行业务引导,且可以满足用户的不同需求,因此实用性较高。
-
-
-
-
-
-
-
-
-