一种基于样本缩放的文本分类的方法

    公开(公告)号:CN110377732A

    公开(公告)日:2019-10-25

    申请号:CN201910567013.X

    申请日:2019-06-27

    Applicant: 江苏大学

    Abstract: 本发明公开了一种基于样本缩放的文本分类的方法,通过计算数据样本到分类超平面的距离,找到离支持向量机的分类面较远的样本并予以删除,并根据这个距离来对剩余的样本赋予相应的权值,然后用这些加权后的数据样本进行支持向量机的训练。本发明所提出的分类方法首先对样本数据进行约减,然后再对数据进行相应的加权,以此来用于在支持向量机进行文本分类。不仅可以降低噪声数据对支持向量机分类的影响,提高模型的噪声抗扰度,而且还减少了支持向量的数量,获得了更好的文本分类准确率。

Patent Agency Ranking