一种基于流式云平台的实时舆情分析方法

    公开(公告)号:CN109903176A

    公开(公告)日:2019-06-18

    申请号:CN201910109044.0

    申请日:2019-02-03

    Abstract: 本发明提供一种基于流式云平台的实时舆情分析方法,该方法包括基于奇异非回溯聚类,用于精准确定关键词聚类的关键词组,对于关键词组的降维更加高效;以及基于关键词之间语义相似度衡量机制,用于筛选关键词组中冗余关键词;以及基于Apache Storm平台,实时更新舆情的表示模型,并实时检测舆情。该发明基于奇异非回溯算法提取舆情的关键词组,并且基于关键词组权重的设计对舆情代表模型进行降维处理,并且基于Apache Storm云平台的拓扑结构,使得对舆情关键词组的选取更加精准,并且压缩了关键词组的维度,提高了实时舆情的分析效率。因此,可以准确表示舆情信息,从而实现了一种高效的流式舆情分析平台,可以在海量文本流中实时发现舆情信息。

    基于气象因子的可吸入颗粒物浓度预测方法、装置及设备

    公开(公告)号:CN119724413A

    公开(公告)日:2025-03-28

    申请号:CN202510217682.X

    申请日:2025-02-26

    Abstract: 本发明公开了一种基于气象因子的可吸入颗粒物浓度预测方法、装置及设备,方法包括:将原始气象因子数据的时间域信号分解为频域信号,得到频域特征表示;将频域特征表示中的每个气象因子的时间序列独立嵌入为令牌,得到每个气象因子的全局特征表示;对每个气象因子的全局特征表示,通过DF‑Net网络的残差式注意力机制进行特征交互,捕捉气象因子间的复杂关联,得到交互后的特征表示;对交互后的特征表示,通过DF‑Net网络的自适应门控单元进行特征选择,动态调整各气象因子的特征重要性,得到优化后的特征表示;对优化后的特征表示,通过DF‑Net网络的全连接层进行汇总与映射,生成可吸入颗粒物浓度的预测值。本发明能够提高可吸入颗粒物浓度预测的准确性。

    一种超短期风力发电功率的预测方法、系统、设备和介质

    公开(公告)号:CN118074120B

    公开(公告)日:2025-01-28

    申请号:CN202410242881.1

    申请日:2024-03-04

    Abstract: 本发明公开了一种超短期风力发电功率的预测方法、系统、设备和介质,其涉及风电技术领域。包括:获取超短期风力发电时对应的气象数据和发电功率的原始时间序列M;选择当前时间点和当前时间点的第一预设时间段前时间点的功率,计算差值得到时间窗口;对原始时间序列M进行重组得到新时间序列N,每隔第二预设时间段采样一次,将相邻采样点整合为采样数据,通过采样数据绘制风力发电功率图;计算金融因子KDJ和RSI,使用LightGBM算法构建预测模型;将气象数据、新时间序列N、金融因子KDJ和RSI组成的数据组输入预测模型得到风力发电功率的预测结果。本发明降低了风电功率预测对高精度气象数据的依赖,能够快速准确地预测风力发电功率。

    一种基于IDSCNN-AM-LSTM的沙尘暴预测方法

    公开(公告)号:CN118278453A

    公开(公告)日:2024-07-02

    申请号:CN202410298587.2

    申请日:2024-03-15

    Abstract: 本发明公开了一种基于IDSCNN‑AM‑LSTM的沙尘暴预测方法,获取沙尘暴数据并进行预处理,预处理的数据以3维张量特征图形式表达;利用卷积神经网络进行一次时空特征提取;卷积神经网络包括逐通道卷积层、逐点卷积层和最大池化层,D个地区的沙尘暴数据以特征图形式输入逐通道卷积层,先由逐通道卷积层提取得到气象‑能见度时间特征,再经逐点卷积层提取得到气象‑能见度时空特征,气象‑能见度时空特征经最大池化层得到三维形式的一次时空特征;引入注意力机制,根据重要程度,为不同时刻的一次时空特征分配不同的权重,得到二次时空特征;叠加一次时空特征和二次时空特征,利用LSTM进行沙尘暴预测。本发明可提高沙尘暴预测的适用范围和预测准确率。

    风电功率预测方法
    35.
    发明公开

    公开(公告)号:CN114692950A

    公开(公告)日:2022-07-01

    申请号:CN202210209056.2

    申请日:2022-03-03

    Abstract: 一种风电功率预测方法,以风电场传感器所接收的原始数据构成原始时间序列集,构建掩码矩阵,然后将原始时间序列集编码至隐藏空间,将隐藏单元传入基于门控循环单元的生成对抗网络,生成伪时间序列集;将伪时间序列集处理后与原始时间序列集通过所述生成对抗网络的鉴别器比对,当均方根误差小于设定阈值时,使用伪时间序列集中的数据插补到原时间序列集的空缺中,形成完整的新时间序列集;利用新时间序列集对风电功率进行预测。本发明可保障短期风电功率预测的运算效率与结果准确度。

    一种基于深度学习的高精度多角度行为识别方法

    公开(公告)号:CN114565970A

    公开(公告)日:2022-05-31

    申请号:CN202210103411.8

    申请日:2022-01-27

    Abstract: 本发明为一种基于深度学习的高精度多角度行为识别方法,首先,收集原始视频数据,对原始视频数据进行数据预处理;其次,基于对比学习的思想应用深度神经网络构建深度学习模型;然后通过深度前馈网络对预处理得到的数据进行特征提取,提取完成后进一步进行动作分类;最后反馈分类后的结果。本发明使用对比学习方法构建自监督模型对数据进行动作分类,有效增强数据特征提取的鲁棒性,使模型学习到更有利于行为分类的知识,并满足了在实际场景下对视频数据中目标行为分类的高准确度需求,为后续依据分类结果进行的其他操作提供良好基础。

    一种基于孤立森林与WGAN网络的风电输出功率预测方法

    公开(公告)号:CN113298297B

    公开(公告)日:2022-03-25

    申请号:CN202110503783.5

    申请日:2021-05-10

    Abstract: 本发明一种基于孤立森林与WGAN网络的风电输出功率预测方法,包括基于孤立森林的风电原始数据异常值检测方法,用于自适应检测并剔除海量风电数据中的异常值;以及基于对抗生成网络的缺失值填补方法,用于探索风电数据的变化规律,从而填补风电数据的缺失值和上一步骤中剔除的异常值;以及面向海量风电数据的归一化方法,用于统一风电数据中不同特征的量纲;以及基于门控循环单元网络的风电功率预测方法,用于高精度超短期风电输出功率预测。本发明可高精度还原风电原始数据的缺失值和剔除的异常值,分析风电数据在时间序列上的变化情况,更好地对异常检测后的风电数据进行插值,得到完整的数据集,准确预测超短期风电输出功率。

    面向非平衡数据基于半监督分布式训练的任务识别方法

    公开(公告)号:CN114154578A

    公开(公告)日:2022-03-08

    申请号:CN202111473280.4

    申请日:2021-12-02

    Abstract: 一种面向非平衡数据基于半监督分布式训练的任务识别方法,首先,边缘设备收集大量的数据,通过自适应数据采样的方式统计数据的类别,按照类别数量从大到小生成一个降序数据集。然后,通过一个多层结构的分布式训练框架得到一个优化模型。其中,边缘节点既可以作为聚合参数的服务器,也可以作为模型训练的训练节点。最后,通过类再平衡自训练对数据集进行调整,生成一个伪标签集并统计标签集的类分布情况,遵守类再平衡规则生成一个伪标签子集,补充到标签集中生成新的数据集,完成一次自训练迭代。本发明充分利用了分布式训练与半监督学习优势,降低了非平衡数据带来的影响,提高了神经网络训练效果。

    一种基于监察数据关联分析的低保资金监督方法与系统

    公开(公告)号:CN111460052B

    公开(公告)日:2021-10-01

    申请号:CN202010275707.9

    申请日:2020-04-09

    Abstract: 一种基于监察数据关联分析的低保资金监督方法,包括:步骤1,获取低保户信息数据和低保资金发放数据并做数据持久化处理,统计每个低保户在一段时间领取每种补贴的总金额与总次数;步骤2,通过关联表间的数据碰撞与决策分析,得到一部分受益人不在低保户信息数据表中却领取低保资金的问题数据,并且提取其中真实低保户领取低保资金的数据;步骤3,在真实低保户领取低保资金的数据中,计算每个低保户在一年内的领取总金额与领取总次数,分别计算领取总金额与领取总次数的数据聚类中心,得到脱离聚类中心的问题数据,即年度领取金额异常数据或者年度领取次数异常数据。本发明实现了高效的监察数据关联分析的最低生活保障资金监督。

    一种基于流式云平台的实时舆情分析方法

    公开(公告)号:CN109903176B

    公开(公告)日:2020-04-10

    申请号:CN201910109044.0

    申请日:2019-02-03

    Abstract: 本发明提供一种基于流式云平台的实时舆情分析方法,该方法包括基于奇异非回溯聚类,用于精准确定关键词聚类的关键词组,对于关键词组的降维更加高效;以及基于关键词之间语义相似度衡量机制,用于筛选关键词组中冗余关键词;以及基于Apache Storm平台,实时更新舆情的表示模型,并实时检测舆情。该发明基于奇异非回溯算法提取舆情的关键词组,并且基于关键词组权重的设计对舆情代表模型进行降维处理,并且基于Apache Storm云平台的拓扑结构,使得对舆情关键词组的选取更加精准,并且压缩了关键词组的维度,提高了实时舆情的分析效率。因此,可以准确表示舆情信息,从而实现了一种高效的流式舆情分析平台,可以在海量文本流中实时发现舆情信息。

Patent Agency Ranking