-
公开(公告)号:CN109299263A
公开(公告)日:2019-02-01
申请号:CN201811180163.7
申请日:2018-10-10
Applicant: 上海观安信息技术股份有限公司
Abstract: 本申请实施例中提供了一种文本分类方法、电子设备及计算机程序产品。采用本申请中的方案,从样本文本中获取中心文本;根据中心文本与待分类文本之间的相似度,选择预设数量个中心文本作为相似中心文本;确定各相似中心文本的权重;根据各相似中心文本的权重确定待分类文本所属类别。本申请中的方案在选择预设数量个相似中心文本之后,不再简单的根据每类中相似中心文本的数量确定待分类文本的所属类别,而是确定各相似中心文本的权重,根据各相似中心文本的权重确定待分类文本所属类别,该方案可以提升文本分类的准确性。
-
公开(公告)号:CN109299263B
公开(公告)日:2021-01-05
申请号:CN201811180163.7
申请日:2018-10-10
Applicant: 上海观安信息技术股份有限公司
IPC: G06F16/35 , G06F40/289
Abstract: 本申请实施例中提供了一种文本分类方法、电子设备及计算机程序产品。采用本申请中的方案,从样本文本中获取中心文本;根据中心文本与待分类文本之间的相似度,选择预设数量个中心文本作为相似中心文本;确定各相似中心文本的权重;根据各相似中心文本的权重确定待分类文本所属类别。本申请中的方案在选择预设数量个相似中心文本之后,不再简单的根据每类中相似中心文本的数量确定待分类文本的所属类别,而是确定各相似中心文本的权重,根据各相似中心文本的权重确定待分类文本所属类别,该方案可以提升文本分类的准确性。
-