-
公开(公告)号:CN109101477A
公开(公告)日:2018-12-28
申请号:CN201810563448.2
申请日:2018-06-04
Applicant: 东南大学
Abstract: 本发明公开了一种企业领域分类及企业关键词筛选方法,该方法通过对企业领域语料库进行训练得出相关领域的特征词汇作为分类词典,然后利用这种分类词典对企业的简介文档进行行业分类,在分类之后,本方法还能从企业的简介文档中提取出能代表这个企业所从事领域的行业标签。此外,本方法能克服中文文本处理中的大多数噪声词影响,行业分类错误率低,分类效率高,综合表现性能优异。
-
公开(公告)号:CN109101477B
公开(公告)日:2023-01-31
申请号:CN201810563448.2
申请日:2018-06-04
Applicant: 东南大学
IPC: G06F16/35 , G06F40/216 , G06F40/289 , G06Q10/06
Abstract: 本发明公开了一种企业领域分类及企业关键词筛选方法,该方法通过对企业领域语料库进行训练得出相关领域的特征词汇作为分类词典,然后利用这种分类词典对企业的简介文档进行行业分类,在分类之后,本方法还能从企业的简介文档中提取出能代表这个企业所从事领域的行业标签。此外,本方法能克服中文文本处理中的大多数噪声词影响,行业分类错误率低,分类效率高,综合表现性能优异。
-