-
公开(公告)号:CN114996446A
公开(公告)日:2022-09-02
申请号:CN202210542220.1
申请日:2022-05-18
Applicant: 苏州大学
IPC: G06F16/35 , G06F40/216
Abstract: 本发明提供的文本分类方法,利用了归一化词频来规避文档长度本身对于词频的影响,从而提供一种归一化词频权重,并将其与现有的文档频次方法融合起来计算判别相关性得分并进行重要程度排序,从而提高了选择判别特征项的能力,选择重要程度高的特征项组成特征子集,在此基础上对文本表示权重矩阵进行分类得到最终的分类结果,提高了文本分类的性能,分类结果更加准确。
-
公开(公告)号:CN114140699B
公开(公告)日:2023-02-10
申请号:CN202111416367.8
申请日:2021-11-25
Applicant: 苏州大学
IPC: G06V20/13 , G06V10/26 , G06V10/764 , G06V10/774
Abstract: 本发明公开了一种基于在线局部Fisher矢量机的SAR图像目标识别方法及系统,包括:S1、对SAR图像训练数据进行裁剪并在行上堆叠为向量数据,对向量数据划分预训练集并利用预训练集中的SAR图像训练数据进行分类模型预训练,以得到一次更新的分类模型参数;S2、将一次更新后的分类模型参数作为初值输入分类模型,并将预训练集加入缓冲池,在分类模型接收到任意样本数据时,将样本数据加入缓冲池对分类模型进行训练,并遍历所有样本数据以得到二次更新的分类模型参数;S3、对SAR图像检测数据进行裁剪并在行上堆叠为向量数据,利用二次更新的分类模型参数来计算分类模型函数值并对数据进行预测分类。本发明具有更高效、更准确、可适应大规模数据的优势。
-
公开(公告)号:CN113626604A
公开(公告)日:2021-11-09
申请号:CN202110997675.8
申请日:2021-08-27
Applicant: 苏州大学
IPC: G06F16/35 , G06F16/957 , G06F40/279
Abstract: 本发明公开了一种基于最大间隔准则的网页文本分类系统,其包括:文本预处理模块,用于对原始文本数据进行预处理并提取文本数据;文本表示模块,用于结合文本的向量空间表示,计算特征项权重,对提取的文本数据进行表示;特征项排序模块,用于基于最大间隔准则对特征项进行相关性排序;文本分类模块,用于利用特征选择后的训练集文本构建分类模型,并利用所述分类模型对特征选择后的测试集文本进行分类。本发明基于最大间隔准则的网页文本分类系统在选择较少数量的特征项时,能够选择出更具有判别性的特征词,提高了网页文本分类的性能,具有适用性强,准确度高的优点。
-
公开(公告)号:CN114610877A
公开(公告)日:2022-06-10
申请号:CN202210169563.8
申请日:2022-02-23
Applicant: 苏州大学
IPC: G06F16/35 , G06F16/36 , G06F40/216 , G06F40/284 , G06N20/00
Abstract: 本发明涉及一种基于判别方差准则的影评情感分析预处理方法,包括对获取的原始影评数据进行分词、清洗和标准化的预处理,并整理得到影评语料库,其中影评语料库包括影评和特征项;基于影评语料库得到影评频次矩阵和词频矩阵;基于影评频次矩阵计算判别方差准则,利用判别方差准则计算影评语料库中每个特征项的判别相关性得分,按照得分降序排列得到特征项重要程度序列;将特征项重要程度序列输入至训练好的分析模型中,输出影评情感分析结果,并对影评情感分析结果进行评估。本发明判别方差准则有效地结合了方差和监督信息,利用判别方差准则对影评文本进行预处理,使得具有较高总体散度和较低类散度的特征项更具判别性,提高影评情感分析的性能。
-
公开(公告)号:CN114140699A
公开(公告)日:2022-03-04
申请号:CN202111416367.8
申请日:2021-11-25
Applicant: 苏州大学
IPC: G06V20/13 , G06V10/26 , G06V10/764 , G06V10/774 , G06K9/62
Abstract: 本发明公开了一种基于在线局部Fisher矢量机的SAR图像目标识别方法及系统,包括:S1、对SAR图像训练数据进行裁剪并在行上堆叠为向量数据,对向量数据划分预训练集并利用预训练集中的SAR图像训练数据进行分类模型预训练,以得到一次更新的分类模型参数;S2、将一次更新后的分类模型参数作为初值输入分类模型,并将预训练集加入缓冲池,在分类模型接收到任意样本数据时,将样本数据加入缓冲池对分类模型进行训练,并遍历所有样本数据以得到二次更新的分类模型参数;S3、对SAR图像检测数据进行裁剪并在行上堆叠为向量数据,利用二次更新的分类模型参数来计算分类模型函数值并对数据进行预测分类。本发明具有更高效、更准确、可适应大规模数据的优势。
-
公开(公告)号:CN114996446B
公开(公告)日:2023-08-25
申请号:CN202210542220.1
申请日:2022-05-18
Applicant: 苏州大学
IPC: G06F16/35 , G06F40/216
Abstract: 本发明提供的文本分类方法,利用了归一化词频来规避文档长度本身对于词频的影响,从而提供一种归一化词频权重,并将其与现有的文档频次方法融合起来计算判别相关性得分并进行重要程度排序,从而提高了选择判别特征项的能力,选择重要程度高的特征项组成特征子集,在此基础上对文本表示权重矩阵进行分类得到最终的分类结果,提高了文本分类的性能,分类结果更加准确。
-
公开(公告)号:CN113626604B
公开(公告)日:2022-07-26
申请号:CN202110997675.8
申请日:2021-08-27
Applicant: 苏州大学
IPC: G06F16/35 , G06F16/957 , G06F40/279
Abstract: 本发明公开了一种基于最大间隔准则的网页文本分类系统,其包括:文本预处理模块,用于对原始文本数据进行预处理并提取文本数据;文本表示模块,用于结合文本的向量空间表示,计算特征项权重,对提取的文本数据进行表示;特征项排序模块,用于基于最大间隔准则对特征项进行相关性排序;文本分类模块,用于利用特征选择后的训练集文本构建分类模型,并利用所述分类模型对特征选择后的测试集文本进行分类。本发明基于最大间隔准则的网页文本分类系统在选择较少数量的特征项时,能够选择出更具有判别性的特征词,提高了网页文本分类的性能,具有适用性强,准确度高的优点。
-
公开(公告)号:CN114070621A
公开(公告)日:2022-02-18
申请号:CN202111356908.2
申请日:2021-11-16
Applicant: 苏州大学
Abstract: 本发明涉及一种面向网络数据流分类的在线稀疏学习方法,包括以下步骤:S1、构建数据缓冲池,向数据缓冲池中输入预设数量的带标签数据流序列,获得初始模型函数;S2、当数据缓冲池接收到带标签的流数据,则利用梯度下降法求解该带标签的流数据的目标函数并更新模型参数;S3、当新的带标签的流数据小于数据缓冲池的容量,则将新的带标签的流数据加入到缓冲池中,转至S2;否则,继续下一步;S4、采用核匹配追踪算法重新分配模型参数以保证模型参数的系数性;S5、采用更新后的模型对无标签流数据进行预测和分类。本发明的在线支持向量机在线学习效率高,模型更新效果好,能够产生稀疏模型。
-
公开(公告)号:CN114610877B
公开(公告)日:2023-04-25
申请号:CN202210169563.8
申请日:2022-02-23
Applicant: 苏州大学
IPC: G06F16/35 , G06F16/36 , G06F40/216 , G06F40/284 , G06N20/00
Abstract: 本发明涉及一种基于判别方差准则的影评情感分析预处理方法,包括对获取的原始影评数据进行分词、清洗和标准化的预处理,并整理得到影评语料库,其中影评语料库包括影评和特征项;基于影评语料库得到影评频次矩阵和词频矩阵;基于影评频次矩阵计算判别方差准则,利用判别方差准则计算影评语料库中每个特征项的判别相关性得分,按照得分降序排列得到特征项重要程度序列;将特征项重要程度序列输入至训练好的分析模型中,输出影评情感分析结果,并对影评情感分析结果进行评估。本发明判别方差准则有效地结合了方差和监督信息,利用判别方差准则对影评文本进行预处理,使得具有较高总体散度和较低类散度的特征项更具判别性,提高影评情感分析的性能。
-
公开(公告)号:CN114070621B
公开(公告)日:2023-01-17
申请号:CN202111356908.2
申请日:2021-11-16
Applicant: 苏州大学
Abstract: 本发明涉及一种面向网络数据流分类的在线稀疏学习方法,包括以下步骤:S1、构建数据缓冲池,向数据缓冲池中输入预设数量的带标签数据流序列,获得初始模型函数;S2、当数据缓冲池接收到带标签的流数据,则利用梯度下降法求解该带标签的流数据的目标函数并更新模型参数;S3、当新的带标签的流数据小于数据缓冲池的容量,则将新的带标签的流数据加入到缓冲池中,转至S2;否则,继续下一步;S4、采用核匹配追踪算法重新分配模型参数以保证模型参数的稀疏性;S5、采用更新后的模型对无标签流数据进行预测和分类。本发明的在线支持向量机在线学习效率高,模型更新效果好,能够产生稀疏模型。
-
-
-
-
-
-
-
-
-