一种基于GAN的水质异常数据检测方法

    公开(公告)号:CN114113516A

    公开(公告)日:2022-03-01

    申请号:CN202111258369.9

    申请日:2021-10-27

    Abstract: 本发明提供一种基于GAN的水质异常数据检测方法,该方法包括对水质数据的预处理方法PCA主成分分析法,用于处理原始水质数据,在最大限度不丢失原始信息的前提下降低数据维度,减少计算量,加速监测时间;训练GAN使其生成器生成的伪正常数据能够达到以假乱真的水平,鉴别器能够达到完全判别出真假数据的水平;以及异常检测,将训练好的生成器和鉴别器用于异常检测,生成器生成的数据和原始数据进行对比得出重构损失,鉴别器对原始数据进行鉴别得出鉴别损失,将两种损失进行相加得到总的损失值,据此判断原始水质数据的正常与否。

    数据处理方法和装置
    12.
    发明授权

    公开(公告)号:CN111966495B

    公开(公告)日:2022-02-01

    申请号:CN202010849131.2

    申请日:2020-08-21

    Abstract: 本发明公开了一种数据处理方法和装置。其中,该数据处理方法包括:获取分布式系统的基于粒子群优化实现负载均衡的数据分发算法;依据基于粒子群优化实现负载均衡的数据分发算法,计算分布式系统中负载均衡的粒子最佳位置;获取分布式系统的基于粒子群优化实现最优化存储的数据分发算法;依据基于粒子群优化实现最优化存储的数据分发算法和负载均衡的粒子最佳位置,对分布式系统中各节点所需的存储空间进行优化。本发明解决了由于现有的全比较计算研究采用的是分支定界法的方法来完成全比较计算的数据分发,导致的计算时间长,效率低的技术问题。

    基于并行改进的K-means算法的大数据文本聚类方法及系统

    公开(公告)号:CN111159406A

    公开(公告)日:2020-05-15

    申请号:CN201911393493.9

    申请日:2019-12-30

    Abstract: 本发明属于文本聚类技术领域,尤其涉及基于并行改进的K-means算法的大数据文本聚类方法及系统,通过Canopy中心点选取算法和K-means基于距离的聚类算法相结合的SWCK-means文本聚类算法处理将低维度的大数据文本数据进行聚类,本发明解决了现有技术存在由于K-means算法没有最优化或局部优化处理,从而导致算法的聚类的准确率和效率低下的问题,具有提高了K-means算法的聚类的准确率和效率、减少文本的维度、提高聚类的效果以及并行化设计的有益技术效果。

    基于SVM的随机特征子空间的风速反演方法

    公开(公告)号:CN118277882A

    公开(公告)日:2024-07-02

    申请号:CN202410390891.X

    申请日:2024-04-02

    Abstract: 本发明公开了一种基于SVM的随机特征子空间的风速反演方法,包括:获取卫星遥感数据进行预处理,并将处理后的遥感数据划分为训练集和测试集;基于随机特征子空间构建构建风速反演模型,并利用训练集对风速反演模型进行训练;其中,风速反演模型包括特征提取模块和随机特征子空间模块;利用测试集评价已训练的所述风速反演模型的性能。本发明首先提高了风速反演模型的效率,将模型的计算资源更多的投入到对风速反演更重要的特征中;其次处理了高维数据和特征空间的异质性,减轻了模型过拟合的风险。

    一种基于P_LSTNet与加权Markov校验的风电输出功率预测方法

    公开(公告)号:CN113988414B

    公开(公告)日:2024-05-28

    申请号:CN202111258373.5

    申请日:2021-10-27

    Abstract: 本发明提供一种基于P_LSTNet与加权Markov校验的风电输出功率预测方法。该方法包括基于主成分分析的数据降维方法和时间滑动窗口的输入数据集构建方法,用于对原始风电数据集进行数据降维和构建输入数据集;以及基于P_LSTNet模型的初步风电输出功率预测方法,用于通过输入的初始风电数据预测初步风电输出功率预测值,充分提取原始数据中的短期特征、长期特征及线性特征;以及基于加权Markov和K‑means++算法的误差值校验,用于提高现有模型预测精准度低下的问题。该发明在充分提取历史风电功率数据的基础上,初步高精度的预测了风电输出功率,并结合加权Markov chain链进一步校验预测误差,并进行误差填补,进一步提高了风电输出功率预测的精准度。

    一种超短期风力发电功率的预测方法、系统、设备和介质

    公开(公告)号:CN118074120A

    公开(公告)日:2024-05-24

    申请号:CN202410242881.1

    申请日:2024-03-04

    Abstract: 本发明公开了一种超短期风力发电功率的预测方法、系统、设备和介质,其涉及风电技术领域。包括:获取超短期风力发电时对应的气象数据和发电功率的原始时间序列M;选择当前时间点和当前时间点的第一预设时间段前时间点的功率,计算差值得到时间窗口;对原始时间序列M进行重组得到新时间序列N,每隔第二预设时间段采样一次,将相邻采样点整合为采样数据,通过采样数据绘制风力发电功率图;计算金融因子KDJ和RSI,使用LightGBM算法构建预测模型;将气象数据、新时间序列N、金融因子KDJ和RSI组成的数据组输入预测模型得到风力发电功率的预测结果。本发明降低了风电功率预测对高精度气象数据的依赖,能够快速准确地预测风力发电功率。

    一种面向边缘智能的高弹性多节点协同模型卸载方法

    公开(公告)号:CN114595000B

    公开(公告)日:2023-05-02

    申请号:CN202210128433.X

    申请日:2022-02-11

    Abstract: 一种面向边缘智能的高弹性多节点协同模型卸载方法。在部署阶段,多边缘节点进行信息感知,构建多边缘节点深度神经网络(Deep Neural Network,DNN)协同执行图,实现神经网络分布式部署;在执行阶段,根据部署阶段生成的执行图运行DNN模型,同时使用故障检测机制检测故障,若检测到发生分区故障,则使用基于延迟改进的策略合理的选择DNN分区的最优部署节点进行卸载备份。并使用随机调度策略来随机选择执行路径。本发明通过提高分布式神经网络的故障弹性,有效规避了边缘节点发生故障对分布式推理的影响。同时,本发明不需要额外的模型重新设计和再训练,保证了执行效率和准确率。

    一种基于对比预测的多视图聚类方法

    公开(公告)号:CN115527052A

    公开(公告)日:2022-12-27

    申请号:CN202211174947.5

    申请日:2022-09-26

    Abstract: 一种基于对比预测的多视图聚类方法,收集若干样本的初始多视图数据,每个样本的视图数据数量为2,将各样本划分为完整数据和不完整数据;构建网络1和网络2;网络1中,编码器将某个样本的两种视图分别投影成潜在表示,两组预测模块基于对比学习,实现潜在表示之间的相互预测;网络2以网络1的解码器生成生成器构建生成对抗网络;利用完整数据训练网络1;利用不完整数据训练网络2,将不完整数据转化为假完整数据;利用假完整数据再次训练网络1,将原始的多视图数据传给网络1学习并获取潜在表示拼接而成的公共表示,在公共表示上使用Kmeans聚类算法得到最后的聚类结果。本发明能够有效利用不完整数据中的隐藏信息,显著提升聚类表现。

    基于禁忌搜索优化算法的全比较数据分发方法

    公开(公告)号:CN113407336B

    公开(公告)日:2022-08-19

    申请号:CN202110530699.2

    申请日:2021-05-15

    Abstract: 本发明公开了一种基于禁忌搜索优化算法的全比较数据分发方法,针对现有的全量分发存在的存储空间浪费问题以及使用HDFS存储无法实现完全数据本地化问题,提出了基于禁忌搜索优化的全比较计算数据分发模型,针对该模型还设计了基于禁忌搜索优化的负载均衡全比较数据分发算法和基于禁忌搜索优化的最小化存储全比较数据分发算法用于计算本发明提出的全比较计算数据分发模型的负载均衡、存储节约能力、数据本地化率以及计算速并进行了仿真实验,实验结果表明该全比较计算数据分发模型有效解决了大规模ATAC的数据分发问题,提高了计算速度,对生物信息学等学科ATAC任务的计算将产生较好的推动效果。

Patent Agency Ranking