一种基于邻域关系的高维数据快速降维方法以及系统

    公开(公告)号:CN114595741B

    公开(公告)日:2023-09-01

    申请号:CN202210051047.5

    申请日:2022-01-17

    Abstract: 本发明公开了一种基于邻域关系的高维数据快速降维方法以及系统,本发明首先通过探索数据点与其邻居的邻居之间的相似性以构建高维空间中数据点的近似邻域结构,避免了成对数据点之间的相似度计算,在提高计算效率的同时获得尽可能高的准确性;然后对由邻居探索而获得的数据点的邻域进行随机采样,快速生成数据点的上下文序列,进一步加快计算效率;最后利用只含一层隐含层的词向量模型Skip‑gram的高效性,学习高维数值矩阵在低维空间的嵌入表示,从而实现降维处理。本发明可处理通用的数值型矩阵,不局限于原始数据类型,并且计算速度高于同类型的Vec2vec方法,计算准确率优于当前最先进的UMAP方法。

    一种知识图谱嵌入的链路预测方法、系统、设备及介质

    公开(公告)号:CN115757809A

    公开(公告)日:2023-03-07

    申请号:CN202211292555.9

    申请日:2022-10-21

    Abstract: 本发明公开了一种知识图谱嵌入的链路预测方法、系统、设备及介质,本方法通过获取知识图谱训练数据集中的实体和关系;将实体嵌入至第一维度空间,并将关系嵌入至第二维度空间,获得实体嵌入向量和关系嵌入向量;将实体嵌入向量和关系嵌入向量分别嵌入至标准化单位向量,获得标准化单位向量输出的标准化实体向量和标准化关系向量;拼接标准化实体向量和标准化关系向量,获得输入向量;采用第一全连接网络将输入向量投影至第三维度空间,获得特征向量;采用第二全连接网络将特征向量投影至第一维度空间,获得输出向量;基于输出向量,构建得分函数;通过得分函数计算获得候选实体的链路预测结果。本发明能够捕获长距离交互,提升链路预测的效果。

    一种基于海浪与海沫的海表粗糙度参数化方法

    公开(公告)号:CN113221312B

    公开(公告)日:2022-09-02

    申请号:CN202110159909.1

    申请日:2021-02-05

    Abstract: 本发明公开一种基于海浪与海沫的海表粗糙度参数化方法,其特征在于,包括以下步骤:Step1、计算TY01(基于波陡δ的参数化方案)与DN03(基于波龄β*的方案)波龄β*分界点;Step2、根据波龄β*分界点选择对应的含有海沫的海表粗糙度参数化方案进行计算;若当前波龄β*小于波龄β*分界点,采用公式z0/Hs=(1‑αf)1.2×102δ4.5+αfzf/Hs;若当前波龄β*大于等于波龄β*分界点,采用公式其中αf是海沫覆盖率,zf是被海沫覆盖的海面粗糙度,Hs是有效波高,提高了在不同风浪条件下的表现,通过加入海沫的影响,本发明的方法在高风速下的适用性得到了提高。

    大气谱模式动力框架高可扩展并行优化方法及系统

    公开(公告)号:CN109002909B

    公开(公告)日:2022-06-14

    申请号:CN201810687173.3

    申请日:2018-06-28

    Abstract: 本发明公开了一种大气谱模式动力框架高可扩展并行优化方法及系统,本发明并行优化方法的步骤包括通过针对大气谱模式的动力框架中六个主要计算过程分别分析计算涉及的数据相关性、对各个过程中无数据相关性的两个数据方向进行二维数据剖分并映射到处理器逻辑结构网格上进行计算,计算过程之间的数据交换采用三维数据转置算法实现;针对整个动力框架计算过程中涉及的部分全局变量,在数据分解的基础上实现变量的全局数据收集;将数据变换过程和数据收集过程与整个动力框架迭代处理流程无缝结合,最终完成各个相邻计算过程之间涉及的三维数据转置处理和全局变量的数据收集。本发明能够极大地提高模式的并行计算可扩展性,从而提升并行执行效率。

    基于n-of-N流模型的不确定轮廓查询并行处理方法及系统

    公开(公告)号:CN108959521B

    公开(公告)日:2021-07-16

    申请号:CN201810688992.X

    申请日:2018-06-28

    Abstract: 本发明公开了一种基于n‑of‑N流模型的不确定轮廓查询并行处理方法及系统,本发明针对大规模不确定数据流的高效n‑of‑N轮廓查询,将对全局滑动窗口中的数据元组查询处理的任务,按一定的任务映射规则划分为多个本地局部滑动窗口,并且将本地局部滑动窗口的查询处理任务分散交付给多个计算节点,所有计算节点对各自局部滑动窗口进行并行查询处理,当完成对所有数据元组处理后返回查询结果。本发明能够实现计算节点间的负载均衡、最大化并行效率、支持大规模计算节点数目的并行查询、实现高效的n‑of‑N查询并行处理。

    一种说话人无关单通道语音分离方法

    公开(公告)号:CN111583954A

    公开(公告)日:2020-08-25

    申请号:CN202010401151.3

    申请日:2020-05-12

    Abstract: 本发明公开了一种说话人无关单通道语音分离方法,包括以下步骤:准备数据集,进行数据预处理;建立基于复数理想浮值掩蔽的单声道语音分离模型;对所述的单声道语音分离模型进行训练时采用语句级置换不变性训练;将混合语音数据输入训练完毕的模型进行语音分离。本发明提出的基于语句级置换不变性训练和复数理想浮值掩蔽的说话人无关单通道语音分离方法,所述方法通过语句级置换不变训练有效而准确地实现了复数理想浮值掩蔽估计,方法中采用了双向长短期记忆神经网络结构估计复数理想浮值掩蔽,并进一步利用语句级置换不变训练的标准解决标签模糊的问题,从而使得单声道语音分离具有较好的效果。

    一种基于本体的高性能计算资源池化索引查询方法

    公开(公告)号:CN110633348A

    公开(公告)日:2019-12-31

    申请号:CN201910693793.2

    申请日:2019-07-30

    Abstract: 本发明公开了一种基于本体的高性能计算资源池化索引查询方法,包括构建高性能计算资源的本体模型;建立基于WordNet的快速资源索引列表;获取输入的查询关键词;根据所述的快速资源索引列表返回查询结果。本发明构建出高性能计算资源本体模型,为跨域超算中心资源的一体化语义表示提供了支撑,有效消除了软硬件资源接口语义歧义,构建出统一透明的多域服务资源池;利用WordNet对快速服务查询列表QSQL进行扩展,支持基于语义模糊化匹配的资源发现;实现对资源或服务的高效语义发现,不仅能够保证传统语义发现的质量,而且实现了服务发现效率的较大提升。

    基于列式数据库的大气海洋数据检索优化方法和装置

    公开(公告)号:CN119537423B

    公开(公告)日:2025-04-01

    申请号:CN202510079099.7

    申请日:2025-01-17

    Abstract: 本申请涉及一种基于列式数据库的大气海洋数据检索优化方法和装置。所述方法包括:对历史大气海洋数据进行多维度按需裁剪提取与数据解码;在要素维度,通过要素切分得到的单要素数据表进行列式数据库中的数据存储与要素维度数据检索优化;在空间维度,通过元数据信息提取进行列式数据库中的数据存储,并基于构建的空间编码进行空间维度数据检索优化;在时间维度,通过时间离散化剖分得到的时间编码进行列式数据库中的数据存储与时间维度数据检索优化;在进行要素维度、空间维度以及时间维度的大气海洋数据检索优化的基础上,进一步基于固定大小的数据块进行数据存储。采用本方法能够提高海量历史大气海洋数据检索访问效率。

    一种基于深度学习的水下溶解氧重构方法和系统

    公开(公告)号:CN118762775A

    公开(公告)日:2024-10-11

    申请号:CN202411220271.8

    申请日:2024-09-02

    Abstract: 本申请涉及了一种基于深度学习的水下溶解氧重构方法和系统,方法使用更高分辨率的网格化数据作为输入数据,并基于深度神经网络构建的重构模型对水下多层的溶解氧含量进行重构;相较于目前采用的线性统计和机器学习的方案,本方法采用了具有更完整的时间空间覆盖尺度的海洋网格化数据,一方面通过重构模型能够充分挖掘网格化数据中所包含更细节、更准确的时空特征信息;另外一方面由于网格化数据包括海表生态要素,且重构过程仅依赖海表数据,这里将生态要素纳入模型输入,实现了更高密度更加全面地重构表层海洋要素与水下多层溶解氧之间的映射联系,不仅解决了水下数据缺少的问题,而且提升了水下溶解氧含量重构的准确性。

    一种条件扩散模型鲁棒性优化方法

    公开(公告)号:CN118520926A

    公开(公告)日:2024-08-20

    申请号:CN202411005676.X

    申请日:2024-07-25

    Abstract: 本申请公开了一种条件扩散模型鲁棒性优化方法,本方法将加噪信息数据集以及预设条件输入至有条件神经网络中进行训练,将加噪信息数据集输入至无条件神经网络中进行训练;获取训练好的有条件神经网络和训练好的无条件神经网络在训练过程中产生的拟合误差,获取在条件扩散模型的反向过程中输入条件错误的情况下,训练好的有条件神经网络产生的量化误差;将拟合误差和量化误差输入至构建好的过滤器中,计算得到目标参数;将训练好的有条件神经网络、训练好的无条件神经网络以及目标参数输入至构建好的控制器中,生成控制信号;将高斯分布和控制信号输入至构建好的生成模型中,得到生成模型输出的生成数据。本申请能够提高模型的可靠性和有效性。

Patent Agency Ranking