一种基于自然邻域密度的数据不平衡分类过采样方法、装置、设备及介质

    公开(公告)号:CN115481300A

    公开(公告)日:2022-12-16

    申请号:CN202211300942.2

    申请日:2022-10-24

    Abstract: 本发明属于数据不平衡预处理领域,具体涉及一种基于自然邻域密度的数据不平衡分类过采样方法,包括:获得待处理的不平衡数据集;搜索不平衡数据集中的数据,构建所有少数类样本的自然邻域;根据每个少数类样本的自然邻域内同质与异质样本的比例关系,筛选出种子样本集;提取每个种子样本的自然邻域密度;计算每个种子样本的权重信息;通过线性插值的方式合成新样本;汇总新合成样本集、种子样本集与多数类样本集,得到采样后的平衡数据集。本发明根据自然邻域关系的无参数邻域搜索策略,能自适应地搜索合适的邻域,也能有效地区分并过滤噪声样本和离群样本,同时,对邻域进行了合理地泛化,平衡数据分布的同时提高了数据质量。

    一种基于支持向量机的数据分类方法及系统

    公开(公告)号:CN113887742A

    公开(公告)日:2022-01-04

    申请号:CN202111248092.1

    申请日:2021-10-26

    Abstract: 本发明公开了一种基于支持向量机的数据分类方法及系统,包括以下步骤:获取待分类数据,采用改进投票率的基于完全随机森林的噪声滤波学习方法进行数据清洗去除待分类数据中的噪声,得到无噪声待分类数据集;对无噪声待分类数据集进行线性映射,得到无噪声线性数据集,通过将惩罚系数设置为其取值范围内的最大值来修正SVM模型;将无噪声线性数据集作为支持向量机的训练集输入到修正后的SVM模型中进行训练和分类,得到数据的分类结果,通过优化投票机制改进了CRF‑NFL的投票机制,并将CRF‑NFL和SVM结合,使得分类器对噪声样本能有更好的识别,使CRF‑NFL更有效地过滤类噪声,从而提高分类器的验证精度。

    一种测量激光晶体无辐射衰减寿命的方法

    公开(公告)号:CN120063667A

    公开(公告)日:2025-05-30

    申请号:CN202510249393.8

    申请日:2025-03-04

    Abstract: 本发明请求保护一种基于固体激光器弛豫振荡频率分析的激光晶体无辐射衰减寿命测量方法,其核心步骤包括:首先,在固体激光器(1)稳定运转状态下,采用自零拍噪声探测装置(2)实时采集激光强度噪声谱,通过谱线特征解析获得激光器弛豫振荡频率实测值;其次,基于激光器速率方程构建弛豫振荡频率理论模型,结合激光器实际运行参数(包括泵浦功率、腔结构参数及晶体特性),建立以激光晶体无辐射衰减寿命为自变量、弛豫振荡频率为因变量的理论函数曲线图;最后,将实测弛豫振荡频率与理论曲线中的频率值进行匹配,通过横坐标反演确定激光晶体的无辐射衰减寿命值。该方法突破传统测量方法的局限,可在激光器持续工作状态下实现非侵入式高精度测量,尤其适用于固体激光系统中激光晶体无辐射衰减动力学的原位表征与寿命评估。

    一种基于相对位置矩阵法和拉曼光谱的氮化物浓度定量分析方法

    公开(公告)号:CN120064237A

    公开(公告)日:2025-05-30

    申请号:CN202510144736.4

    申请日:2025-02-10

    Abstract: 本发明涉及一种基于相对位置矩阵法和拉曼光谱的氮化物浓度定量分析方法,属于拉曼光谱定量分析领域。该方法包括如下步骤:通过拉曼光谱仪采集样本的拉曼光谱数据,建立拉曼光谱数据集;对拉曼光谱数据集进行平滑和基线扣除,对数据集进行数据增强和数据归一化;使用相对位置矩阵法将预处理后的数据集进行二维转换;基于原始的一维光谱数据和转化的二维图像数据,训练多模态融合的神经网络模型;利用训练好的模型实现水中的硝酸盐与亚硝酸盐浓度定量检测。本发明将拉曼光谱与相对位置矩阵法结合,实现了水样中氮化物浓度的定量检测,为拉曼光谱在实际水样检测中的大规模应用提供了技术支持。

    一种基于权重的不平衡数据分类过采样方法及系统

    公开(公告)号:CN113971730A

    公开(公告)日:2022-01-25

    申请号:CN202111247023.9

    申请日:2021-10-26

    Abstract: 本发明公开了一种基于权重的不平衡数据分类过采样方法及系统,根据待处理不平衡数据样本自带的分类标签构造若干棵完全随机树,得到完全随机森林;根据每个少数类样本在每棵完全随机树中的初步判定结果,计算每个少数类样本在完全随机森林中的权重;并判断每个少数类样本是否为噪声样本,并从少数类样本集中过滤掉所有噪声样本,根据不同过采样算法的策略从去噪声少数类样本集中筛选种子样本,对种子样本进行插值处理生成新样本;将种子样本、新样本、多数类样本集、去噪声少数类样本集进行汇总,得到采样后的平衡数据集,通过构建完全随机树计算少数类的权重,不用考虑调参问题,自适应各种情况,减少了噪声样本的产生,提高采样精度。

Patent Agency Ranking