-
公开(公告)号:CN1245696C
公开(公告)日:2006-03-15
申请号:CN03145419.4
申请日:2003-06-13
Applicant: 北京大学计算机科学技术研究所 , 北京北大方正技术研究院有限公司
Inventor: 孙晋文
Abstract: 本发明属于智能信息处理技术,具体涉及一种融合关键词学习的支持向量机文本分类增量训练学习方法。现有的方法忽略了随着增量训练而应有的文档关键词的学习问题,使得增量训练效果要低于非增量的一次性训练。本发明针对关键词在训练中的重要作用,提出了同步考虑关键词“增量”学习的方法,在增量训练过程中,同时进行分类关键词的学习与调节,从而消除了增量训练相对于一次性训练的不足。本发明所提出的融合关键词学习的增量训练方法可获得与一次性训练相一致的分类精度,优于没有进行关键词学习的方法。
-
公开(公告)号:CN1460947A
公开(公告)日:2003-12-10
申请号:CN03145419.4
申请日:2003-06-13
Applicant: 北京大学计算机科学技术研究所 , 北京北大方正技术研究院有限公司
Inventor: 孙晋文
Abstract: 本发明属于智能信息处理技术,具体涉及一种融合关键词学习的支持向量机文本分类增量训练学习方法。现有的方法忽略了随着增量训练而应有的文档关键词的学习问题,使得增量训练效果要低于非增量的一次性训练。本发明针对关键词在训练中的重要作用,提出了同步考虑关键词“增量”学习的方法,在增量训练过程中,同时进行分类关键词的学习与调节,从而消除了增量训练相对于一次性训练的不足。本发明所提出的融合关键词学习的增量训练方法可获得与一次性训练相一致的分类精度,优于没有进行关键词学习的方法。
-