一种基于GPT3的问答系统文本生成方法及装置

    公开(公告)号:CN115809322A

    公开(公告)日:2023-03-17

    申请号:CN202211413500.9

    申请日:2022-11-11

    Abstract: 本发明公开一种基于GPT3的问答系统文本生成方法及装置,该方法包括:将语料集合中的样本文本S转化为向量Is;对输入的语料集合按照步骤S1的方法生成字向量矩阵V;基于所述初始查询矩阵和键值矩阵构建注意力矩阵A;根据所述字向量矩阵V和注意力矩阵A计算样本矩阵P;将所述样本矩阵P作为输入,进行多层Performer编码计算后得到矩阵Px;基于步骤S5的方法,对所述样本矩阵P进行不断迭代训练,构建文本生成模型M;利用所述文本生成模型M自动生成文本。本专利可以通过该生成式问答系统,能够对答案库进行扩展,便于与用户进行无感交互,解决了现有业务知识库中业务问答对较多,但无法覆盖所有业务场景、无法覆盖用户问题的技术问题。

    一致性数据写入方法、系统、电子设备及存储介质

    公开(公告)号:CN115587105A

    公开(公告)日:2023-01-10

    申请号:CN202211238277.9

    申请日:2022-10-11

    Abstract: 本申请实施例提供了一致性数据写入方法、系统、电子设备及存储介质,应用于数据源的连接器或者目的地的连接器,数据源的连接器用于将数据从数据源写入Kafka,目的地的连接器用于将数据从Kafka写入目的地,首先判断连接器是否具备事务能力;若具备事务能力,则通过连接器,将数据写入操作与偏置写入操作作为同一个事务进行提交,以在数据写入操作与偏置写入操作均完成后,确定事务执行成功;若不具备事务能力,则通过连接器,利用二阶段提交协议,确定数据写入操作和偏置写入操作均执行完成后,确定数据写入完成,通过对连接器是否具备事务能力进行判断,并采取不同的应对措施,以保证数据写入前后数据的一致性。

    一种云平台的资源管理方法、装置及电子设备

    公开(公告)号:CN115480916A

    公开(公告)日:2022-12-16

    申请号:CN202211087029.9

    申请日:2022-09-07

    Abstract: 本申请公开了一种云平台的资源管理方法、装置及电子设备,涉及云计算技术领域。该方法包括:在第一云主机中启动应用程序时,所述第一云主机调用预分配的第一CPU群组,确定所述第一云主机对应的可用的内存资源,判定所述第一云主机对应的可用的内存资源是否大于运行所述应用程序所需的内存资源,若是,则在所述第一云主机中运行所述应用程序,若否,则调用第二云主机以及所述第二云主机预分配的第二CPU群组。通过将异构多云管理云平台中的CPU进行分组,进一步将每台云主机与预分配的CPU群组进行绑定,在云主机中运行应用程序时,应用程序只需要访问云主机对应的CPU群组和内存资源,极大的提升了访问速度和处理效率。

    一种样本数据自动生成方法、装置及存储介质

    公开(公告)号:CN114693902A

    公开(公告)日:2022-07-01

    申请号:CN202011561818.2

    申请日:2020-12-25

    Abstract: 本申请公开了一种样本数据自动生成方法、装置及存储介质,涉及图像处理领域,用以减少收集数据时所占用的资源。该方法包括:将各待加载字段加载到背景图片的预设位置上,生成第一样本图片;将所述第一样本图片加载到预设三维模型上,得到样本模型;在三维空间对所述样本模型进行模拟拍照,得到第二样本图片。通过模拟生成平面图片,并对平面图片进行三维化,最终得到符合要求的三维OCR样本。这样,通过自动生成样本数据,可以代替现有技术中的收集数据的过程,从而减少收集数据时所占用的资源。

    一种建立短文本多层级分类模型的方法和系统

    公开(公告)号:CN114579737A

    公开(公告)日:2022-06-03

    申请号:CN202111636972.6

    申请日:2021-12-29

    Abstract: 本发明实施例公开了一种建立短文本多层级分类模型的方法和系统,所述方法包括:对同一份短文本数据集,按照设置的不同层级的短文本类别标签进行标注后生成的不同层级的标注数据集,并将其作为输入,对基于公开的预训练模型Bert base后接全连接层建立的分类模型分层级进行训练,生成不同层级的分类模型,并在训练下一层级分类模型时,将上一层级经过微调的预训练模型Bert base的部分训练参数迁移到下一层级初始预训练模型Bert base的对应部分,最后将生成的多层级的分类模型进行组合生成最终的分类模型。所述方法和系统可有效扩增每种类别下的数据总量,解决模型训练的数据稀疏度问题;并对低层级的分类学习,通过迁移高层级分类模型的通用参数提升训练效果。

    一种业务交互网络的预测方法及装置

    公开(公告)号:CN114519445A

    公开(公告)日:2022-05-20

    申请号:CN202011294355.8

    申请日:2020-11-18

    Abstract: 本公开涉及数据处理技术领域,尤其涉及一种业务交互网络的预测方法及装置,解决建立的业务交互网络不完整,以及无法对潜在的业务关系进行预测的问题,方法为:获取采集的各个业务数据,建立交互网络,再建立邻接矩阵和特征矩阵,再将所述邻接矩阵和所述特征矩阵,输入预测模型,得到业务交互预测矩阵,然后将所述业务交互预测矩阵中元素进行处理后,生成业务交互网络矩阵,并基于所述业务交互网络矩阵确定预测的业务交互网络。这样,采用业务数据生成的交互网络,预测业务交互网络,规避建立预测交互网络时,需要检索确定同种业务类型的全部交互对象,使得建立的业务交互网络不完整的弊端,而且能够预测出存在潜在交互可能的交互对象。

    一种标准问题推荐方法、装置、介质和设备

    公开(公告)号:CN114443942A

    公开(公告)日:2022-05-06

    申请号:CN202011214886.1

    申请日:2020-11-04

    Abstract: 本发明涉及一种标准问题推荐方法、装置、介质和设备。根据本发明实施例提供的方案,可以根据获取的指定用户历史曾经提问的每个标准问题对应的标准问题序列,利用预先训练出的将递归神经网络模型与线性模型进行融合获得的推荐模型,确定出针对指定用户的待推荐的标准问题的标识,进而将对应的标准问题推荐给指定用户。从而可以通过将递归神经网络模型与线性模型进行融合获得的推荐模型,对用户下一步可能提问的标准问题进行快速准确预测,实现标准问题的快速准确推荐。

    键值数据表的连接方法及装置

    公开(公告)号:CN108205571B

    公开(公告)日:2022-04-29

    申请号:CN201611182420.1

    申请日:2016-12-20

    Inventor: 胡懋地 林文辉

    Abstract: 本发明提供了一种键值数据表的连接方法及装置,其方法包括:获取第一键值数据表中每个第一关键字对应的第一布隆数组,以及获取第二键值数据表中每个第二关键字对应的第二布隆数组;过滤掉第一布隆数组、第二布隆数组对应的一定不存在重复关系的第一关键字和第二关键字;根据过滤处理后的第一布隆数组对应的第一关键字、第二布隆数组对应的第二关键字,进行第一键值数据表和第二键值数据表的连接。本发明实施例提供的键值数据表的连接方法及装置,先过滤掉需要连接的第一键值数据表与第二键值数据表中一定不存在重复关系的第一关键字与第二关键字,再进行连接,减少了需要连接的数据总量,从而减少了计算成本,提高了计算效率。

Patent Agency Ranking