一种基于子特征选择的概念漂移检测与适应方法

    公开(公告)号:CN118260687A

    公开(公告)日:2024-06-28

    申请号:CN202410284057.2

    申请日:2024-03-13

    Abstract: 本发明公开了一种基于子特征选择的概念漂移检测与适应方法,步骤如下:1)收集数据形成数据集,构建基于集成分类器的分类预测模型、基于单类分类器的概念漂移检测器,初始化完成后二者开始并行工作;2)使用概念漂移检测器进行概念漂移检测,当检测到异常数据点的比例大于警告阈值时,认为发生漂移,进行后续步骤并更新概念漂移检测器;3)使用二分类器进行子特征漂移幅度检测,检测发生概念漂移的数据块中各个子特征的漂移幅度,作为集成分类预测模型的更新权重;4)在检测到概念漂移之后,以各子特征的漂移幅度作为权重更新集成分类预测模型,并采用特征淘汰机制淘汰所有漂移幅度大于某一阈值且对分类器性能没有提升的子特征,完成集成分类预测模型的更新。本发明通过单类分类器在无监督的条件下进行概念漂移检测,在检测到漂移后对发生漂移的数据集中的各个子特征进行漂移幅度检测,从而找到在发生概念漂移前后分布变化最大的部分子特征,正是这些子特征的变化导致了概念漂移现象。

    一种移动分子通信中信号检测方法

    公开(公告)号:CN118094219A

    公开(公告)日:2024-05-28

    申请号:CN202410108080.6

    申请日:2024-01-25

    Abstract: 本发明公开了一种移动分子通信中信号检测方法,构建基于Informer的信号检测神经网络模型,所述信号检测神经网络模型包括位置编码模块、编码器模块、位置编码的解码模块和解码器模块,并分析样本数据中接收纳米机器所接收的分子数序列的自相关系数,确定信号检测神经网络模型的输入长度,对信号检测神经网络模型进行训练,采用训练好的信号检测神经网络模型,构建需要检测的MMC系统的输入序列,进行预测得到所接收的传输信号。本申请通过对模型结构的修改,减少模型训练时间;通过固定输入长度减少模型训练以及计算的时间,大幅简化训练难度,并设计输入长度的固定方式以最大化输入信息的完整度。

    基于Spark大数据平台的电瓶车用户行为习惯分析方法

    公开(公告)号:CN109189747B

    公开(公告)日:2022-03-15

    申请号:CN201810889375.6

    申请日:2018-08-07

    Abstract: 本发明针对不同类型电瓶车用户的行驶习惯提出一种基于Spark大数据平台的电瓶车用户行为习惯分析方法,所述方法包含以下步骤:步骤1)、采集安装在每辆电瓶车上传感器的状态数据,包括行驶平均速度、放电时间、充放电次数和电压值等4种属性状态,其中电压字段用于对电瓶车类型分类;步骤2)、在大数据Spark平台上分别调用K‑Means聚类算法接口和DBSCAN聚类算法对电瓶车用户数据集进行聚类;步骤3)、使用联合Sorgenfrei系数对这两种聚类结果进行相似性评价,调整簇数k后再循环执行步骤2)获得两种算法的聚类结果,并再次用联合Sorgenfrei系数计算聚类结果的相似性指标;步骤4)、选择当联合Sorgenfrei系数取得最大时的k值作为最优簇数,输出确定最优簇数后两种算法聚类结果的交集。

    基于电瓶车状态数据的电池使用寿命预测方法

    公开(公告)号:CN107219463B

    公开(公告)日:2019-11-12

    申请号:CN201710340766.8

    申请日:2017-05-12

    Abstract: 本发明针对不同类型电瓶车的用户使用习惯提出一种基于概率统计的电池组寿命预测方法,所述方法包含以下步骤:步骤1)、对影响电瓶车电池使用寿命的用户习惯如行驶里程数和电池放电时间这两个重要因素进行统计与分析;步骤2)、根据电压值对电瓶车类型进行分类,建立电瓶车用户使用习惯与电池寿命间的关联模型;步骤3)、利用训练样本集对关联模型进行参数估计;步骤4)、将待测试的新用户行驶里程数和累计放电时间代入对应的电池寿命状态函数进行计算,得出电池寿命状态的标准量,与设置阈值进行比较后得到当前电瓶车用户的电池寿命状态结论。

    面向数据流的低时延内存B+树索引构建方法

    公开(公告)号:CN106021560B

    公开(公告)日:2019-04-09

    申请号:CN201610373112.0

    申请日:2016-05-30

    Abstract: 面向数据流的低时延内存B+树索引构建方法,重复执行以下步骤:1)通过时间戳为wT的时间窗接收数据,按等时间分片处理数据,每个分片数据接收完后即进行排序,并与之前已排序数据归并,时间窗到期后异步开启新的时间窗并继续后续步骤;2)获窗口元组总量,计算树结构参数:层数,内部节点的子节点数,内部节点数,叶子节点数,叶子节点的子节点数等;3)据步骤2)的参数一次性分配所需的数据结构;4)自底向上依次并行构建叶子节点和内节点得到子树,其根节点指针为rtPtr;5)将元组 插入到全局B+树上并转步骤1)。

    基于Spark大数据平台的电瓶车用户行为习惯分析方法

    公开(公告)号:CN109189747A

    公开(公告)日:2019-01-11

    申请号:CN201810889375.6

    申请日:2018-08-07

    Abstract: 本发明针对不同类型电瓶车用户的行驶习惯提出一种基于Spark大数据平台的电瓶车用户行为习惯分析方法,所述方法包含以下步骤:步骤1)、采集安装在每辆电瓶车上传感器的状态数据,包括行驶平均速度、放电时间、充放电次数和电压值等4种属性状态,其中电压字段用于对电瓶车类型分类;步骤2)、在大数据Spark平台上分别调用K-Means聚类算法接口和DBSCAN聚类算法对电瓶车用户数据集进行聚类;步骤3)、使用联合Sorgenfrei系数对这两种聚类结果进行相似性评价,调整簇数k后再循环执行步骤2)获得两种算法的聚类结果,并再次用联合Sorgenfrei系数计算聚类结果的相似性指标;步骤4)、选择当联合Sorgenfrei系数取得最大时的k值作为最优簇数,输出确定最优簇数后两种算法聚类结果的交集。

    大数据驱动的学生有氧能力分群方法

    公开(公告)号:CN107680679A

    公开(公告)日:2018-02-09

    申请号:CN201710724181.6

    申请日:2017-08-22

    Abstract: 大数据驱动的学生有氧能力分群方法,它含以下步骤:1)将有氧能力数据作为隐马尔科夫模型(HMM)的观察数据,初始化HMM参数;2)训练HMM求解模型参数,据此HMM,基于观察序列进行HMM预测,求得状态转化序列;3)利用状态转化序列计算出每个学生的有氧能力模型;4)利用学生的有氧能力模型,使用KL距离计算每学生个体之间的相似度,得到学生之间的相似度矩阵,并使用层次聚类对学生体质进行分群。本发明提出了大数据驱动的学生有氧能力分群方法,能够据有氧能力将学生进行分群处理,实现学生体质的个性化画像与分群,可用于体育个性化锻炼、训练。

    基于电瓶车状态数据的电池使用寿命预测方法

    公开(公告)号:CN107219463A

    公开(公告)日:2017-09-29

    申请号:CN201710340766.8

    申请日:2017-05-12

    Abstract: 本发明针对不同类型电瓶车的用户使用习惯提出一种基于概率统计的电池组寿命预测方法,所述方法包含以下步骤:步骤1)、对影响电瓶车电池使用寿命的用户习惯如行驶里程数和电池放电时间这两个重要因素进行统计与分析;步骤2)、根据电压值对电瓶车类型进行分类,建立电瓶车用户使用习惯与电池寿命间的关联模型;步骤3)、利用训练样本集对关联模型进行参数估计;步骤4)、将待测试的新用户行驶里程数和累计放电时间代入对应的电池寿命状态函数进行计算,得出电池寿命状态的标准量,与设置阈值进行比较后得到当前电瓶车用户的电池寿命状态结论。

    基于(t,n)门限的关系型数据库水印嵌入及提取方法

    公开(公告)号:CN101105832B

    公开(公告)日:2010-06-23

    申请号:CN200710070278.6

    申请日:2007-08-13

    Abstract: 一种基于(t,n)门限的关系型数据库水印的嵌入方法,依照关系型数据库设定以下参数:水印图像、Lagrange插值多项式中的大素数p、标记算法中的用户密钥user_key、(t,n)门限中的t,n值、数据变动范围len,所述数据变动范围len是小数点后第t位起、共len位能够变动;对水印图像进行数值化处理,得到图像的数值化表示形式bigint;利用(t,n)门限算法以及Lagrange插值多项式,完成水印的嵌入。并提供了该水印的提取方法。本发明具有较好鲁棒性,水印图像稳定性好、水印图像计算效率高、实用性强。

    基于区间数的不确定网格多QoS测量方法

    公开(公告)号:CN101286898A

    公开(公告)日:2008-10-15

    申请号:CN200810061759.5

    申请日:2008-05-22

    Abstract: 一种在不确定网格环境下基于区间数的多QoS参数测量方法,包括以下三个步骤:1)基于区间数的QoS需求与QoS评估等级;2)基于区间数的多QoS集成算子;3)计算期望效用函数值。通过上述方法进行处理后,我们将用户基于各个属性提交的QoS模糊区间需求值转化为一个全局的QoS需求值,从而确定各个用户的QoS的优先级大小。在不确定环境下,基于区间数的网格多QoS参数测量方法,将模糊数学中基于扩展的D-S理论的不确定方法应用到当前的服务质量计算中来,是一种全新的方法,与现有的计算服务质量的方法比起来更加的合理有效。本发明实用性强、能够处理由不确定性引起的不精确性,较好地处理模糊信息的集成问题。

Patent Agency Ranking