-
公开(公告)号:CN111814851B
公开(公告)日:2021-07-06
申请号:CN202010584834.7
申请日:2020-06-24
Applicant: 重庆邮电大学
IPC: G06K9/62
Abstract: 本发明属于煤矿瓦斯安全邻域,具体涉及一种基于单类支持向量机的煤矿瓦斯数据标记方法,包括:实时获取原始数据集,将原始数据集进行分类,得到二分类不平衡数据集;采用K‑means聚类算法对二分类不平衡数据集进行处理,得到k个样本池;每个样本池包括一个未打标的样本池和一个打标的样本池;将k个样本池中的数据分别输入到单类支持向量机模型中,预测k个未打标样本池中的打标标签;根据预测的打标标签对原始数据进行打标;本发明在对煤矿瓦斯数据进行标记时采用单类支持向量机主动学习,减少了煤矿瓦斯数据的标记样本;本发明在进行主动学习过程中加入密度以及分布信息,使得挑选的样本更具有代表性。
-
公开(公告)号:CN111814851A
公开(公告)日:2020-10-23
申请号:CN202010584834.7
申请日:2020-06-24
Applicant: 重庆邮电大学
IPC: G06K9/62
Abstract: 本发明属于煤矿瓦斯安全邻域,具体涉及一种基于单类支持向量机的煤矿瓦斯数据标记方法,包括:实时获取原始数据集,将原始数据集进行分类,得到二分类不平衡数据集;采用K-means聚类算法对二分类不平衡数据集进行处理,得到k个样本池;每个样本池包括一个未打标的样本池和一个打标的样本池;将k个样本池中的数据分别输入到单类支持向量机模型中,预测k个未打标样本池中的打标标签;根据预测的打标标签对原始数据进行打标;本发明在对煤矿瓦斯数据进行标记时采用单类支持向量机主动学习,减少了煤矿瓦斯数据的标记样本;本发明在进行主动学习过程中加入密度以及分布信息,使得挑选的样本更具有代表性。
-