一种基于TaPas模型和图注意力网络的表格问答处理方法

    公开(公告)号:CN115794871B

    公开(公告)日:2025-05-23

    申请号:CN202211563273.8

    申请日:2022-12-07

    Abstract: 本发明属于自然语言处理、表格问答技术领域,尤其是涉及一种基于TaPas模型和图注意力网络的表格问答处理方法。本发明提出使用图注意力神经网络来利用和融合TAPAS预训练模型提取的特征向量。在wikiSQL数据集上的实验结果表明,使用图注意力网络的TAPAS模型的准确度为87.0%,超过仅使用两个全连接层时TAPAS模型的准确度。同时,TAPAS模型对输入的表格问题对的文本长度是有限的,一般为512个符号,这就导致了TAPAS无法处理较大的表格。本发明提出了一种预处理表格的方法,通过提取表格中与问题有关的列,来缩小表格的大小,称这样的预处理操作为快照。在对表格做了快照之后,本发明的模型在WIkiSQL上的准确度上升至89.8%。

    一种基于MIMO架构的查询优化器优化方法

    公开(公告)号:CN119988431A

    公开(公告)日:2025-05-13

    申请号:CN202510143749.X

    申请日:2025-02-10

    Abstract: 本发明属于数据库查询优化技术领域,具体涉及一种基于MIMO架构的查询优化器优化方法。本发明首先是提出了多输入多输出(MIMO)子网架构的计划排序器。该模型利用多个子网的功能来独立预测候选查询计划,并生成鲁棒的复合预测,同时预测查询计划排名分数中的不确定性的测量。其次,设计不确定性感知的计划选择策略,来选择最优方案。通过无缝集成到数据库管理系统中,使得现有的查询优化器在保持高预测精度的同时,在鲁棒查询优化方面有了显著的改进。

    一种适用MongoDB数据库的多租户数据共享存储系统

    公开(公告)号:CN113190529B

    公开(公告)日:2023-09-19

    申请号:CN202110474219.5

    申请日:2021-04-29

    Abstract: 本发明公开了一种适用MongoDB数据库的多租户数据共享存储系统,包括客户端、服务端和网络传输模块;网络传输模块用于在客户端和服务端之间进行数据通信和数据传输;服务端用于根据处理后的数据库服务请求执行对应的数据库操作,并将请求结果返回至客户端;客户端用于提供数据的读写接口,以及将用户的数据库服务请求进行处理,通过网络连接将处理后的数据库服务请求发送至服务端,同时根据相应的数据格式和协议对服务端返回的请求结果进行解析并呈现给用户。本发明使用元数据管理和命名空间等机制相结合的方式进行实现了多租户对于数据库实例的共享,为了提供多个租户在共享使用同一个数据库实例时的数据隔离,保证了每个租户数据的完整性和安全性。

    一种基于图神经网络的数据库查询优化方法及系统

    公开(公告)号:CN113010547B

    公开(公告)日:2023-04-07

    申请号:CN202110491751.8

    申请日:2021-05-06

    Abstract: 本发明公开了一种基于图神经网络的数据库查询优化方法及系统,方法包括:数据采集:根据数据的使用规律来合理的调节采样行为;基数及代价估计:利用树型图神经网络提取查询计划树的结构特征,并使用图卷积网络提取各个数据列的关联关系及连接的拓扑关系,从而建立基数及代价估计网络模型;连接顺序优化:利用图卷积算法提取查询特征和连接顺序特征,并利用强化学习算法感知数据库真实环境,从而不断优化模型,从而提升连接顺序决策的效果;通过对数据分布特征、关联关系和数据库环境特点的学习,建立基数估计模型和连接顺序优化模型,并将算法融合到分布式关系型数据库中。本发明提高在逻辑优化和物理优化阶段的算法效率,提升了查询执行速度。

    一种面向冷热数据的分级存储系统及方法

    公开(公告)号:CN112948398A

    公开(公告)日:2021-06-11

    申请号:CN202110476035.2

    申请日:2021-04-29

    Abstract: 本发明公开了一种面向冷热数据的分级存储系统及方法,系统包括数据采集模块、冷热数据判定模块和冷热数据迁移模块;其中,数据采集模块用于采集用户数据访问请求;冷热数据判定模块用于分析数据访问请求同时根据分析出的温度计算相关信息计算数据温度,并将温度计算相关信息和数据温度更新并重新封装至原始数据;冷热数据迁移模块用于对热库中的数据进行监控,将不符合热库中两个设定阈值的热数据迁移到冷库中,并根据数据访问特征动态调整设定阈值。本发明基于数据的访问时间、访问频率和数据关联性三个方面的特征,对数据的温度进行量化,实现对冷热数据的判定和冷热数据的分离存储。

    一种数据库错误数据修复方法
    7.
    发明公开

    公开(公告)号:CN111522807A

    公开(公告)日:2020-08-11

    申请号:CN202010350654.2

    申请日:2020-04-28

    Abstract: 本发明公开了一种数据库错误数据修复方法,首先通过数据库访问模块获取目标数据库中的数据表,根据数据表中现有数据建立数据库表不同属性列之间的关系模式;然后利用建立好的关系模式通过正确属性列中的数据从领域知识库查询以获取正确的数据;最后,通过数据库访问模块将正确数据写回数据库中。本发明通过建立显式和隐式的关系模式,通过查询知识库以获取正确的数据,可以在修复的时候结合整个数据库中不同表的关联数据在知识库中进行数据的查找,因此可以有效提高数据库中无显式实际意义的外键列的错误数据修复效率,从而提高整个数据库错误数据的修复效率。

    一种分布式文件重复数据删除系统及方法

    公开(公告)号:CN111522791A

    公开(公告)日:2020-08-11

    申请号:CN202010362251.X

    申请日:2020-04-30

    Abstract: 本发明公开了一种分布式文件重复数据删除系统及方法。系统包括元信息服务节点,元信息服务节点用于管理数据块的内容地址;元信息表,用于存储HDFS系统中所有数据块的内容地址;至少一个HDFS客户端,其包括元信息服务节点和元信息表,去重文件在HDFS客户端上写入,HDFS客户端将重文件切分为多个数据块,计算每个数据块的指纹值,并调用元信息服务节点查询元信息表,去除重复的数据块,将节点中剩余数据块重组后,之后将剩余数据块和索引数据重组后生成新的索引文件,并与NameNode节点交互将索引文件存储到HDFS上,同时将新产生的数据指纹存储在HDFS客户端数据库的元信息表中。通过本发明使得HDFS客户端快速完成文件的重复数据删除和分布式存储。

    一种基于时空上下文关联的行为识别方法

    公开(公告)号:CN111242101A

    公开(公告)日:2020-06-05

    申请号:CN202010154587.7

    申请日:2020-03-08

    Abstract: 本发明属于识别技术领域,提供了一种基于时空上下文关联的深度网络模型的行为识别方法。其主旨在于解决CNN模型中空间特征学习范围受到感知域大小的限制的问题,降低了模型对行为特征表示的损失,从而提高行为识别精准度。其主要方案为所将用户行为数据导入进行卷积映射操作,然后利用网格LSTM神经网络得到行为时空特征图TSF并导入注意力门模块进行不同时间特征权重学习,得到行为特征图并传入softmax分类器计算得到行为类别的概率分布D;对行为类别的概率分布D和训练集行为标签Y进行交叉熵损失函数运算,得到损失Loss0,并引入l2损失函数作为最后的总损失函数L;根据总损失函数L,利用反向传播操作修改模型可虚席参数的数值,得到深度网络模型M。

    移动终端转屏系统及方法
    10.
    发明授权

    公开(公告)号:CN104735263B

    公开(公告)日:2017-06-20

    申请号:CN201510159603.0

    申请日:2015-04-03

    Abstract: 本发明公开了一种移动终端转屏系统及方法,包括至少一个移动终端、一转屏移动终端选取模块、一转屏控制模块和一被转屏幕;转屏移动终端选取模块用于从多个移动终端中识别出需要进行转屏的移动终端;转屏控制模块用于控制将需要进行转屏的移动终端上的内容转屏到被转屏幕上进行显示。本发明可自动识别出驾驶员移动终端,并自动将驾驶员移动终端上的信息转屏到车载屏幕上,提高了行车安全;自动划分应用消息发送者与车上乘客之间的社群,分析识别乘客与消息发送者之间的关系,只有在乘客与消息发送者关系密切的情况下才对驾驶员手机上的应用消息进行转屏,突破传统车载互联系统“无脑”转屏的方式,在提高行车安全的同时极大地保护了驾驶员的隐私。

Patent Agency Ranking