基于Spark的并行化随机标签子集多标签文本分类方法

    公开(公告)号:CN106874478A

    公开(公告)日:2017-06-20

    申请号:CN201710086932.6

    申请日:2017-02-17

    CPC classification number: G06F17/30705 G06F2216/03

    Abstract: 本发明请求保护一种基于Spark大数据平台的并行化随机标签子集多标签文本分类方法。首先,读取大规模文本数据集和配置信息文件,创建分布式数据集RDD,将训练数据集和预测数据集缓存到内存中,完成初始化操作。其次,并行地随机生成规定数目的标签子集,由原始训练集为每一个标签子集生成一个新的训练集,再次,将新训练集的多个标签通过标签幂集法转换为单个标签,该数据集转化为一个单标签多类数据集,并行地为这些数据集训练一个基分类器。然后,进行预测将得到的单标签多类预测结果转化为多标签结果。最后,将所有预测结果进行汇总投票,得到测试集最终的多标签预测结果。本发明提高了分类的精度、大幅降低处理大规模多标签数据的学习时间。

    一种文字识别方法及装置
    23.
    发明公开

    公开(公告)号:CN104915627A

    公开(公告)日:2015-09-16

    申请号:CN201410088106.1

    申请日:2014-03-11

    Abstract: 本发明实施例公开了一种文字识别方法及装置,所述方法包括:接收输入的任一待识别文字;将所述待识别文字进行向量处理后,得到所述待识别文字的待识别特征集,所述待识别特征集包括待识别特征;根据所述待识别特征生成预设个数的待识别超边;将所述待识别超边与预先存储的超边库中的超边进行对比,当所述待识别超边与所述超边库中的超边匹配个数满足预设条件时,确定所述待识别文字识别成功。与现有技术相比,本发明能够提高文字的识别效率,同时尽量避免识别误差的产生。

    一种基于上采样机制和类激活映射的图像分类结果特征可视化方法

    公开(公告)号:CN116468941B

    公开(公告)日:2025-05-27

    申请号:CN202310400157.2

    申请日:2023-04-14

    Abstract: 本发明公开了一种基于上采样机制和类激活映射的图像分类结果特征可视化方法,该方法使用了卷积神经网络的最后一层的激活图和梯度矩阵。通过将原始输入图片进行多尺度放大,获取不同分辨率的激活图和梯度矩阵;然后将他们融合并加权相加得到初始掩膜,经过多尺度融合后的掩膜拥有更加丰富的特征信息;归一化处理后的掩膜直接与输入图片进行点乘,来扰动输入图片;将扰动后的输入图片送入模型得到每个掩膜的对应的类别概率分数作为权重,最终将权重和掩膜线性相加组合得到特征可视化结果。本发明应用于包含卷积层的图像分类神经网络,可以呈现噪声更少,分辨率更高,特征定位更加精准的特征可视化效果。

    一种基于多层次对齐的跨域EEG信号情绪识别方法

    公开(公告)号:CN119760539A

    公开(公告)日:2025-04-04

    申请号:CN202411830951.1

    申请日:2024-12-12

    Abstract: 本发明属于脑机接口情绪识别领域,具体涉及一种基于多层次对齐的跨域EEG信号情绪识别方法,包括:获取脑电信号,将脑电信号输入到训练好的情绪识别模型中,得到情绪分类结果;情绪识别模型的训练过程包括:获取脑电信号并进行预处理,将预处理后的脑电数据划分为源域数据和目标域数据;对源域和目标域数据进行特征提取,得到浅层特征和深层特征;根据浅层特征的无条件MMD损失和深层特征的条件MMD损失更新模型参数,直到得到训练好的情绪识别模型;本发明通过浅层特征的无条件MMD损失有效减少了域间的通用特征差异,通过深层特征的条件MMD损失进一步增强了不同类别的特征一致性,实现了源域与目标域之间的精细特征对齐。

    一种基于数据增强的跨被试脑电信号情绪识别方法

    公开(公告)号:CN117743934A

    公开(公告)日:2024-03-22

    申请号:CN202311768703.4

    申请日:2023-12-20

    Abstract: 本发明属于脑机接口领域,涉及一种基于数据增强的跨被试脑电信号情绪识别方法,包括:获取脑电信号并进行预处理;将预处理后的数据划分为源域和目标域数据;对源域数据进行数据屏蔽,将屏蔽后的数据输入数据增强网络,得到生成数据;将生成数据和目标域数据输入判别器,得到浅层域特征;将源域和目标域数据输入特征提取器,得到源域和目标域的浅层情绪特征;将源域浅层情绪特征输入分类器,得到分类结果;计算总体损失函数值,根据总体损失函数值更新参数,当达到训练次数时完成模型训练;本发明将脑电数据映射到矩阵中,使得矩阵包含脑电的空间信息以及电极间未测量区域的信息,将屏蔽后的数据通过数据增强网络得到多样化且具有真实分布的数据。

    一种基于神经网络的人类大脑活动解码方法及系统

    公开(公告)号:CN117420908A

    公开(公告)日:2024-01-19

    申请号:CN202311353598.8

    申请日:2023-10-19

    Abstract: 本发明属于大脑脑机接口领域,具体涉及一种基于神经网络的人类大脑活动解码方法及系统;该方法包括:获取图像特征向量并将其输入到预训练的图像生成器得到刺激图像;采集用户观察刺激图像产生的脑电信号和眼电信号;对脑电信号和眼电信号进行预处理,得到预处理好的脑电信号;采用预训练的脑电信号编码网络对脑电信号进行特征编码,得到初级脑电特征;根据初级脑电特征得到脑电信号分类结果;采用预训练的映射网络对初级脑电特征进行处理,得到预测电脑特征;将预测脑电特征输入到预训练的图像生成器中进行处理,得到重建图像;本发明可根据大脑的反应来重建视觉刺激的内容,实现图像‑脑电图‑图像的变换。

    一种基于分类器链的汽车评论主题提取方法

    公开(公告)号:CN109783636B

    公开(公告)日:2023-03-28

    申请号:CN201811517941.7

    申请日:2018-12-12

    Abstract: 本发明请求保护一种基于分类器链的汽车评论主题提取方法,包括:101汽车评论文本数据预处理,对汽车论坛用户历史评论数据进行预处理操作;102评论文本向量化,使用加权TF‑IDF方法对数据预处理后的每条文本进行向量化从而提取文本特征;103评论主题聚类划分,使用k‑means算法对文本主题聚类划分,得到现有主题类别的一个划分;104局部多标签分类器链主题提取算法设计:将一条完整的分类器链转化为多条局部分类器链,同时每条局部分类器链采用距离类簇中心点由远到近的原则构建链,最后多条局部分类器链集成得到最终预测结果。本发明基于汽车论坛的用户历史评论数据,提取文本特征,设计改进的局部分类器算法,建立预测模型,从而预测每条评论属于哪些主题。

    一种基于大数据金融的黑产用户预测方法

    公开(公告)号:CN110232473B

    公开(公告)日:2022-12-27

    申请号:CN201910430445.6

    申请日:2019-05-22

    Abstract: 本发明请求保护一种基于大数据金融的黑产用户预测方法,包括:101对用户的历史操作数据和历史交易数据进行预处理操作;102对经过预处理的数据进行特征工程构建;103对特征工程构造的特征进行筛选;104建立多个机器学习模型,通过模型融合提高模型的泛化性能;105通过建立的模型,对用户是否是黑产用户进行预测。本发明主要是通过用户30天的操作数据和交易数据以及黑产用户信息,构建特征工程,建立机器学习模型,从而能够在未来通过用户行为预测用户是否是黑产用户,来识别交易风险,切实结合当下的技术发展需求。

Patent Agency Ranking