-
公开(公告)号:CN1808474A
公开(公告)日:2006-07-26
申请号:CN200610009761.9
申请日:2006-03-02
Applicant: 哈尔滨工业大学
CPC classification number: G06K9/6251
Abstract: 基于自组织映射网络的文档聚类方法,本发明涉及一种文档聚类方法。它克服了已有的自组织映射聚类方法难以做到对输入文档数据的自适应以及其固定结构所带来的神经元欠利用、网络映射欠准确以及边缘效应等问题。本发明方法的步骤:找出所有被选文档;将自组织映射网络的输出层初始化为环形结构,并把环形结构至少平分为两半,其中的每个扇形分别作为一个神经元;计算当前输出层的R2聚类准则系数;判断R2聚类准则系数是否大于阈值μ;结果为是,则终止自组织映射网络的训练,把被选文档按照当前自组织映射网络进行分类;结果为否,则在当前输出层中寻找具有最大类内离差平方和的神经元,在其附近插入新的神经元,并对当前输出层的所有神经元进行训练。