一种摘报文本生成方法、装置、服务器及可读存储介质

    公开(公告)号:CN111858908A

    公开(公告)日:2020-10-30

    申请号:CN202010139749.X

    申请日:2020-03-03

    Abstract: 本发明提供了一种摘报文本生成方法,包括:步骤一,获取数据源;步骤二,数据预处理;步骤三,聚类处理;步骤四,簇内长词合并和关键词提取;步骤五,词频统计;步骤六,摘报文本生成。本发明还提供了一种摘报文本生成装置,包括:依次连接的数据源获取模块、数据预处理模块、聚类处理模块、词语候选集获取模块、词频统计模块和摘报文本生成模块,总之,本发明是一种信息更加全面、效率更高、精准度更高的摘报文本生成方法、装置、服务器及可读存储介质,能够提高工作效率的同时且能够满足工作精度需求,能够让用户在有限的时间片段里,尽可能多且越准确地获取可靠信息,提升用户使用体验度,满足个性化阅读需求,具有重要的研究意义和使用价值。

    一种基于语义分析和大数据指数的政务文本质量评价方法

    公开(公告)号:CN119180272A

    公开(公告)日:2024-12-24

    申请号:CN202411245067.1

    申请日:2024-09-06

    Abstract: 本发明提供了一种基于语义分析和大数据指数的政务文本质量评价方法,包括如下步骤:第一步:根据待评价政务文本需要体现的n个维度设定对标数据采集源并进行数据采集;第二步:文本数据预处理,对第一步采集到的n个对标文本数据集进行文本数据预处理;第三步:对标政务文本数据集与待评价政务文本数据集的自然语言处理;第四步:n个分指数计算。依次计算待评价政务文本数据集与n个对标政务文本数据集的余弦相似度,依次得到n个分指数ρ分;第五步:对n个分指数进行加权,得到总指数ρ总。本发明利用大数据与人工智能技术构建的评价政务文本质量的大数据指数,能够通过智能化算法从相关性角度对政务文本的质量给出客观、智能的质量评价结果。

    一种基于大语言模型的标签体系建设方法

    公开(公告)号:CN119025672A

    公开(公告)日:2024-11-26

    申请号:CN202410891650.3

    申请日:2024-07-04

    Abstract: 本发明提供了一种基于大语言模型的标签体系建设方法,包括如下步骤:第一步:待处理文本整理和入库,第二步:调用预训练大模型使用其生成能力打出标签;第三步:对经过第二步得到的所有标签进行标签后处理;第四步:对经过第三步中标签后处理得到的标签进行聚类;第五步:对经过第四步得到的聚类结果利用预训练大模型得到标签体系;第六步:标签体系入库;第七步:使用构建的标签体系对第一步中得到的文本库打标签;该方法结合了深度学习、自然语言处理和大规模预训练模型的最新进展,解决当前文本分类需要预先建立标签体系以及标签体系不能完全反映文本内容分类问题,适用于多种文本类型,解决了现有技术中的弊端。

    一种政务文本主题词库构建方法、装置、服务器及可读存储介质

    公开(公告)号:CN110705285B

    公开(公告)日:2022-11-22

    申请号:CN201910889703.7

    申请日:2019-09-20

    Abstract: 本发明提供了一种政务文本主题词库构建方法、装置、服务器及可读存储介质,涉及数据处理技术领域技术领域,包括:步骤一,获取现有政务文本主题词库;步骤二,获取历届次政务文本词库;步骤三,获取网络政务文本扩充词库;步骤四,对经过所述步骤一、所述步骤二和所述步骤三分别获得的所述现有政务文本主题词库、所述历届次政务文本词库和所述网络政务文本扩充词库进行去重处理,形成最终政务文本主题词库,总之,本发明提供的政务文本主题词库构建方法、装置,工作量小、模型简单,能够大大提高工作效率的同时且能够满足工作精度需求,具有重要的研究意义和使用价值。

    一种政务文本主题词库构建方法、装置、服务器及可读存储介质

    公开(公告)号:CN110705285A

    公开(公告)日:2020-01-17

    申请号:CN201910889703.7

    申请日:2019-09-20

    Abstract: 本发明提供了一种政务文本主题词库构建方法、装置、服务器及可读存储介质,涉及数据处理技术领域技术领域,包括:步骤一,获取现有政务文本主题词库;步骤二,获取历届次政务文本词库;步骤三,获取网络政务文本扩充词库;步骤四,对经过所述步骤一、所述步骤二和所述步骤三分别获得的所述现有政务文本主题词库、所述历届次政务文本词库和所述网络政务文本扩充词库进行去重处理,形成最终政务文本主题词库,总之,本发明提供的政务文本主题词库构建方法、装置,工作量小、模型简单,能够大大提高工作效率的同时且能够满足工作精度需求,具有重要的研究意义和使用价值。

    一种大数据一体机及其使用方法

    公开(公告)号:CN108958947A

    公开(公告)日:2018-12-07

    申请号:CN201811083903.5

    申请日:2018-09-17

    CPC classification number: G06F9/5027 G06F9/45558 G06F2009/45587 G09B19/0053

    Abstract: 本发明实施例提供一种大数据一体机及其使用方法,其中大数据一体机包括数据处理单元和存储单元,数据处理单元与存储单元连接;存储单元内存储有数据集和大数据实验模板,数据处理单元通过虚拟机将数据集提供给学习终端,数据处理单元通过虚拟机内的Docker容器将大数据实验模板提供给学习终端。本发明实施例提供的大数据一体机及其使用方法,通过设计虚拟机+Docker容器的结构,基于大数据一体机实现了虚拟机管理与Docker容器管理的高度统一,为大数据教学和培训提供了友好、便捷、真实可操作的实践环境,减轻了大数据教学的工作量,降低了教学成本,提高了教学灵活性。

    一种大数据一体机及其使用方法

    公开(公告)号:CN108958947B

    公开(公告)日:2024-09-27

    申请号:CN201811083903.5

    申请日:2018-09-17

    Abstract: 本发明实施例提供一种大数据一体机及其使用方法,其中大数据一体机包括数据处理单元和存储单元,数据处理单元与存储单元连接;存储单元内存储有数据集和大数据实验模板,数据处理单元通过虚拟机将数据集提供给学习终端,数据处理单元通过虚拟机内的Docker容器将大数据实验模板提供给学习终端。本发明实施例提供的大数据一体机及其使用方法,通过设计虚拟机+Docker容器的结构,基于大数据一体机实现了虚拟机管理与Docker容器管理的高度统一,为大数据教学和培训提供了友好、便捷、真实可操作的实践环境,减轻了大数据教学的工作量,降低了教学成本,提高了教学灵活性。

    一种大数据一体机
    8.
    实用新型

    公开(公告)号:CN209265421U

    公开(公告)日:2019-08-16

    申请号:CN201821516328.9

    申请日:2018-09-17

    Abstract: 本实用新型实施例提供一种大数据一体机,包括数据处理单元和存储单元,数据处理单元与存储单元连接;存储单元内存储有数据集和大数据实验模板,数据处理单元通过虚拟机将数据集提供给学习终端,并通过虚拟机内的Docker容器将大数据实验模板提供给学习终端。本实用新型实施例提供的大数据一体机,通过设计虚拟机+Docker容器的结构,基于大数据一体机实现了虚拟机管理与Docker容器管理的高度统一,为大数据教学和培训提供了友好、便捷、真实可操作的实践环境,减轻了大数据教学的工作量,降低了教学成本,提高了教学灵活性。(ESM)同样的发明创造已同日申请发明专利

Patent Agency Ranking