-
公开(公告)号:CN110705285B
公开(公告)日:2022-11-22
申请号:CN201910889703.7
申请日:2019-09-20
Applicant: 北京市计算中心有限公司
IPC: G06F40/289 , G06F16/36
Abstract: 本发明提供了一种政务文本主题词库构建方法、装置、服务器及可读存储介质,涉及数据处理技术领域技术领域,包括:步骤一,获取现有政务文本主题词库;步骤二,获取历届次政务文本词库;步骤三,获取网络政务文本扩充词库;步骤四,对经过所述步骤一、所述步骤二和所述步骤三分别获得的所述现有政务文本主题词库、所述历届次政务文本词库和所述网络政务文本扩充词库进行去重处理,形成最终政务文本主题词库,总之,本发明提供的政务文本主题词库构建方法、装置,工作量小、模型简单,能够大大提高工作效率的同时且能够满足工作精度需求,具有重要的研究意义和使用价值。
-
公开(公告)号:CN110705285A
公开(公告)日:2020-01-17
申请号:CN201910889703.7
申请日:2019-09-20
Applicant: 北京市计算中心
IPC: G06F40/289 , G06F16/36
Abstract: 本发明提供了一种政务文本主题词库构建方法、装置、服务器及可读存储介质,涉及数据处理技术领域技术领域,包括:步骤一,获取现有政务文本主题词库;步骤二,获取历届次政务文本词库;步骤三,获取网络政务文本扩充词库;步骤四,对经过所述步骤一、所述步骤二和所述步骤三分别获得的所述现有政务文本主题词库、所述历届次政务文本词库和所述网络政务文本扩充词库进行去重处理,形成最终政务文本主题词库,总之,本发明提供的政务文本主题词库构建方法、装置,工作量小、模型简单,能够大大提高工作效率的同时且能够满足工作精度需求,具有重要的研究意义和使用价值。
-
公开(公告)号:CN111858908A
公开(公告)日:2020-10-30
申请号:CN202010139749.X
申请日:2020-03-03
Applicant: 北京市计算中心
IPC: G06F16/34 , G06F16/35 , G06F40/186 , G06F40/242 , G06F40/284 , G06F40/289
Abstract: 本发明提供了一种摘报文本生成方法,包括:步骤一,获取数据源;步骤二,数据预处理;步骤三,聚类处理;步骤四,簇内长词合并和关键词提取;步骤五,词频统计;步骤六,摘报文本生成。本发明还提供了一种摘报文本生成装置,包括:依次连接的数据源获取模块、数据预处理模块、聚类处理模块、词语候选集获取模块、词频统计模块和摘报文本生成模块,总之,本发明是一种信息更加全面、效率更高、精准度更高的摘报文本生成方法、装置、服务器及可读存储介质,能够提高工作效率的同时且能够满足工作精度需求,能够让用户在有限的时间片段里,尽可能多且越准确地获取可靠信息,提升用户使用体验度,满足个性化阅读需求,具有重要的研究意义和使用价值。
-
-