-
公开(公告)号:CN115809322A
公开(公告)日:2023-03-17
申请号:CN202211413500.9
申请日:2022-11-11
Applicant: 航天信息股份有限公司
IPC: G06F16/332 , G06F40/126 , G06F18/214
Abstract: 本发明公开一种基于GPT3的问答系统文本生成方法及装置,该方法包括:将语料集合中的样本文本S转化为向量Is;对输入的语料集合按照步骤S1的方法生成字向量矩阵V;基于所述初始查询矩阵和键值矩阵构建注意力矩阵A;根据所述字向量矩阵V和注意力矩阵A计算样本矩阵P;将所述样本矩阵P作为输入,进行多层Performer编码计算后得到矩阵Px;基于步骤S5的方法,对所述样本矩阵P进行不断迭代训练,构建文本生成模型M;利用所述文本生成模型M自动生成文本。本专利可以通过该生成式问答系统,能够对答案库进行扩展,便于与用户进行无感交互,解决了现有业务知识库中业务问答对较多,但无法覆盖所有业务场景、无法覆盖用户问题的技术问题。
-
公开(公告)号:CN115757358A
公开(公告)日:2023-03-07
申请号:CN202211526916.1
申请日:2022-11-30
Applicant: 航天信息股份有限公司 , 河北航天信息技术有限公司
IPC: G06F16/21 , G06F16/22 , G06F16/248
Abstract: 本发明公开了一种基于数据集成的多源主数据建模维护分发方法及系统。该方法包括:将多源数据的数据源进行配置,获取主数据,所述数据源包括文件数据源、接口数据源以及数据库数据源;基于所述主数据的模型信息,创建主数据模型,并发布主数据模型;对所述主数据模型进行数据管理,包括查看数据、新增数据、修改和删除数据、查找重复数据以及展示主数据接口信息;根据外部业务系统的不同需求,将主数据在保证其唯一性的前提下加工成外部业务系统直接可使用的主数据,并通过数据集成的实时触发运行。
-
公开(公告)号:CN115587105A
公开(公告)日:2023-01-10
申请号:CN202211238277.9
申请日:2022-10-11
Applicant: 航天信息股份有限公司
IPC: G06F16/23 , G06F16/2455 , G06F9/46
Abstract: 本申请实施例提供了一致性数据写入方法、系统、电子设备及存储介质,应用于数据源的连接器或者目的地的连接器,数据源的连接器用于将数据从数据源写入Kafka,目的地的连接器用于将数据从Kafka写入目的地,首先判断连接器是否具备事务能力;若具备事务能力,则通过连接器,将数据写入操作与偏置写入操作作为同一个事务进行提交,以在数据写入操作与偏置写入操作均完成后,确定事务执行成功;若不具备事务能力,则通过连接器,利用二阶段提交协议,确定数据写入操作和偏置写入操作均执行完成后,确定数据写入完成,通过对连接器是否具备事务能力进行判断,并采取不同的应对措施,以保证数据写入前后数据的一致性。
-
公开(公告)号:CN115587015A
公开(公告)日:2023-01-10
申请号:CN202211228567.5
申请日:2022-10-08
Applicant: 航天信息股份有限公司
Abstract: 本申请提供一种数据处理方法、装置、电子设备及存储介质,包括:接收用户通过用户管理界面输入的接口配置信息;基于所述接口配置信息进行配置,建立数据服务接口;通过所述数据服务接口与外部的数据源进行数据访问,并生成用于记录至少部分数据访问过程的访问日志。该方案能提供生成日志的功能。
-
公开(公告)号:CN115480916A
公开(公告)日:2022-12-16
申请号:CN202211087029.9
申请日:2022-09-07
Applicant: 航天信息股份有限公司
IPC: G06F9/50
Abstract: 本申请公开了一种云平台的资源管理方法、装置及电子设备,涉及云计算技术领域。该方法包括:在第一云主机中启动应用程序时,所述第一云主机调用预分配的第一CPU群组,确定所述第一云主机对应的可用的内存资源,判定所述第一云主机对应的可用的内存资源是否大于运行所述应用程序所需的内存资源,若是,则在所述第一云主机中运行所述应用程序,若否,则调用第二云主机以及所述第二云主机预分配的第二CPU群组。通过将异构多云管理云平台中的CPU进行分组,进一步将每台云主机与预分配的CPU群组进行绑定,在云主机中运行应用程序时,应用程序只需要访问云主机对应的CPU群组和内存资源,极大的提升了访问速度和处理效率。
-
公开(公告)号:CN114693902A
公开(公告)日:2022-07-01
申请号:CN202011561818.2
申请日:2020-12-25
Applicant: 航天信息股份有限公司
Abstract: 本申请公开了一种样本数据自动生成方法、装置及存储介质,涉及图像处理领域,用以减少收集数据时所占用的资源。该方法包括:将各待加载字段加载到背景图片的预设位置上,生成第一样本图片;将所述第一样本图片加载到预设三维模型上,得到样本模型;在三维空间对所述样本模型进行模拟拍照,得到第二样本图片。通过模拟生成平面图片,并对平面图片进行三维化,最终得到符合要求的三维OCR样本。这样,通过自动生成样本数据,可以代替现有技术中的收集数据的过程,从而减少收集数据时所占用的资源。
-
公开(公告)号:CN114579737A
公开(公告)日:2022-06-03
申请号:CN202111636972.6
申请日:2021-12-29
Applicant: 航天信息股份有限公司 , 河北航天信息技术有限公司
Abstract: 本发明实施例公开了一种建立短文本多层级分类模型的方法和系统,所述方法包括:对同一份短文本数据集,按照设置的不同层级的短文本类别标签进行标注后生成的不同层级的标注数据集,并将其作为输入,对基于公开的预训练模型Bert base后接全连接层建立的分类模型分层级进行训练,生成不同层级的分类模型,并在训练下一层级分类模型时,将上一层级经过微调的预训练模型Bert base的部分训练参数迁移到下一层级初始预训练模型Bert base的对应部分,最后将生成的多层级的分类模型进行组合生成最终的分类模型。所述方法和系统可有效扩增每种类别下的数据总量,解决模型训练的数据稀疏度问题;并对低层级的分类学习,通过迁移高层级分类模型的通用参数提升训练效果。
-
公开(公告)号:CN114519445A
公开(公告)日:2022-05-20
申请号:CN202011294355.8
申请日:2020-11-18
Applicant: 航天信息股份有限公司
Abstract: 本公开涉及数据处理技术领域,尤其涉及一种业务交互网络的预测方法及装置,解决建立的业务交互网络不完整,以及无法对潜在的业务关系进行预测的问题,方法为:获取采集的各个业务数据,建立交互网络,再建立邻接矩阵和特征矩阵,再将所述邻接矩阵和所述特征矩阵,输入预测模型,得到业务交互预测矩阵,然后将所述业务交互预测矩阵中元素进行处理后,生成业务交互网络矩阵,并基于所述业务交互网络矩阵确定预测的业务交互网络。这样,采用业务数据生成的交互网络,预测业务交互网络,规避建立预测交互网络时,需要检索确定同种业务类型的全部交互对象,使得建立的业务交互网络不完整的弊端,而且能够预测出存在潜在交互可能的交互对象。
-
公开(公告)号:CN114443942A
公开(公告)日:2022-05-06
申请号:CN202011214886.1
申请日:2020-11-04
Applicant: 航天信息股份有限公司
IPC: G06F16/9535 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种标准问题推荐方法、装置、介质和设备。根据本发明实施例提供的方案,可以根据获取的指定用户历史曾经提问的每个标准问题对应的标准问题序列,利用预先训练出的将递归神经网络模型与线性模型进行融合获得的推荐模型,确定出针对指定用户的待推荐的标准问题的标识,进而将对应的标准问题推荐给指定用户。从而可以通过将递归神经网络模型与线性模型进行融合获得的推荐模型,对用户下一步可能提问的标准问题进行快速准确预测,实现标准问题的快速准确推荐。
-
公开(公告)号:CN108205571B
公开(公告)日:2022-04-29
申请号:CN201611182420.1
申请日:2016-12-20
Applicant: 航天信息股份有限公司
IPC: G06F16/2455 , G06F16/22
Abstract: 本发明提供了一种键值数据表的连接方法及装置,其方法包括:获取第一键值数据表中每个第一关键字对应的第一布隆数组,以及获取第二键值数据表中每个第二关键字对应的第二布隆数组;过滤掉第一布隆数组、第二布隆数组对应的一定不存在重复关系的第一关键字和第二关键字;根据过滤处理后的第一布隆数组对应的第一关键字、第二布隆数组对应的第二关键字,进行第一键值数据表和第二键值数据表的连接。本发明实施例提供的键值数据表的连接方法及装置,先过滤掉需要连接的第一键值数据表与第二键值数据表中一定不存在重复关系的第一关键字与第二关键字,再进行连接,减少了需要连接的数据总量,从而减少了计算成本,提高了计算效率。
-
-
-
-
-
-
-
-
-