一种文本分类方法

    公开(公告)号:CN114357168B

    公开(公告)日:2022-08-02

    申请号:CN202111672999.0

    申请日:2021-12-31

    Abstract: 本发明公开了一种文本分类方法,涉及文本智能处理领域,所述方法包括:构建第一文本分类模型;采集样本文本数据,对所述样本文本数据进行处理获得训练集;利用所述训练集训练所述第一文本分类模型获得第二文本分类模型;获得待分类文本数据,将所述待分类文本数据输入所述第二文本分类模型,所述第二文本分类模型输出所述待分类文本数据的分类结果;本方法能够提升对长文本的文本信息的提取效果。

    动态扩张存储集群方法、装置、终端及存储介质

    公开(公告)号:CN114048222A

    公开(公告)日:2022-02-15

    申请号:CN202111414118.5

    申请日:2021-11-25

    Abstract: 本发明实施例公开了一种动态扩张存储集群方法、装置、终端及存储介质,应用于基于RS码的存储系统中,该方法包括:当需要对存储集群进行扩张时,对所述存储集群添加预设数量的扩充节点;根据所述扩充节点的数量,扩充RS码的生成矩阵,以得到新的生成矩阵;当有新数据存入所述扩充节点中时,根据更新前的原始RS校验块、所述新数据、所述生成矩阵的扩充部分进行计算得到更新后的RS校验块,完成校验更新。本方法使得服务器不需要停机维护,也能快速的实现新存入数据的校验更新,节约了扩张成本和窗口时间。

    一种基于三元影响因子的农业数据存储处理系统及方法

    公开(公告)号:CN111124295B

    公开(公告)日:2021-06-04

    申请号:CN201911270374.4

    申请日:2019-12-11

    Abstract: 本发明属于数据存储技术领域,公开了一种基于三元影响因子的农业数据存储处理系统及方法,对于第一次存储的数据块,文件对数据块的引用数量为1,根据程序访问的时间局部性原理,被正在被访问的数据块近期它很可能还会被再次访问;对于已经存储的数据块,动态更新计算数据块的冷热程度也需要综合考虑三个影响因子:文件对数据块的引用数量、数据块的读写频率以及时间间隔周期,对引用数量和读取频率设置不同的初始权重,且权重随时间间隔周期动态变化。本发明对于热度越高的数据可以越快的被访问到,同时对冷数据采用纠删码策略进行冗余存储,节约了系统存储空间。文件对数据块的引用数量表示它被一个或多个文件引用的次数。

    一种基于Scrapy框架的数据采集方法、系统及存储介质

    公开(公告)号:CN111881337B

    公开(公告)日:2021-06-01

    申请号:CN202010784262.7

    申请日:2020-08-06

    Abstract: 本发明公开了一种基于Scrapy框架的数据采集方法、系统及存储介质,使用先后发送两次请求,第一次请求得到更新cookie、第二次请求携带更新的cookie得到数据的方式,结合延迟请求和先后发送两次请求,每次请求都使用上一次请求返回的更新cookie,请求后提取出返回的更新cookie,同时解决了ip限制和动态cookie的限制,解决了现有技术中难以通过爬虫爬取动态网页数据的问题,实现了克服动态网页的反爬机制、高效快速的获得所需数据的目的。

    基于迭代改进APF的无人驾驶汽车避碰路径规划方法与系统

    公开(公告)号:CN112327887A

    公开(公告)日:2021-02-05

    申请号:CN202110006196.5

    申请日:2021-01-05

    Abstract: 本发明提供一种基于迭代改进APF的无人驾驶汽车避碰路径规划方法与系统,方法包括:S1:建立二维工作空间,标记起始点、终点和障碍物;S2:在工作空间离散多个单元格,获取单元格对应的势值;S3:对势值排序,设定阈值,标记大于阈值的单元格;S4:对单元格进行遍历,获得两个标记簇,降低阈值,重复S3,直到两个标记簇有交叉点;S5:记录使两个标记簇有交叉点的阈值及阈值对应的单元格,找到满足只有一个单元格连接两个标记簇的单元格,设为第一中点;S6:重复S4‑S5,获得满足要求的中点,所有中点和起点、终点相连形成一条无障碍的路径。本方法能在短时间内规划出避开障碍物的路径,且路径距离极短。

    一种基于Scrapy框架的数据采集方法、系统及存储介质

    公开(公告)号:CN111881337A

    公开(公告)日:2020-11-03

    申请号:CN202010784262.7

    申请日:2020-08-06

    Abstract: 本发明公开了一种基于Scrapy框架的数据采集方法、系统及存储介质,使用先后发送两次请求,第一次请求得到更新cookie、第二次请求携带更新的cookie得到数据的方式,结合延迟请求和先后发送两次请求,每次请求都使用上一次请求返回的更新cookie,请求后提取出返回的更新cookie,同时解决了ip限制和动态cookie的限制,解决了现有技术中难以通过爬虫爬取动态网页数据的问题,实现了克服动态网页的反爬机制、高效快速的获得所需数据的目的。

    一种滑坡次声信号识别方法

    公开(公告)号:CN110196448B

    公开(公告)日:2020-06-16

    申请号:CN201910427631.4

    申请日:2019-05-21

    Abstract: 本发明提供一种滑坡次声信号识别方法,包括以下步骤:采集多种不同类型的来自滑坡体的土壤,获取滑坡次声信号;通过野外现场采集环境干扰次声信号;分别分析所述滑坡次声信号和干扰次声信号在时、频域上的相关特征以及特征差异,提炼出一系列具有表征性的关键特征;根据所述关键特征,结合KNN分类算法,建立滑坡次声信号智能识别模型,对监测到的信号进行判别。本发明能够排除环境噪声干扰,实现滑坡次声信号的准确识别。

    一种高效高可靠的大数据存储系统、方法、计算机程序

    公开(公告)号:CN110457161A

    公开(公告)日:2019-11-15

    申请号:CN201910681574.2

    申请日:2019-07-26

    Abstract: 本发明属于信息数据处理技术领域,公开了一种高效高可靠的大数据存储系统、方法、计算机程序,按照配置中心设置获取用户上传的数据;阵列化模块,计算出编码的阵列;读取阵列化模块计算的阵列,按照阵列进行编码;主节点和从节点之间互相发送心跳信息,读取配置中心的心跳延迟时间;解析出失效节点信息;进行数据恢复;根据要下载的数据ID查询各个原始数据分块的位置;读取配置中心的设置,负责分配编码后的分块存储节点,以及数据恢复时选择的新生节点;配置中心,负责管理系统中的各种参数;存储编码后的分块。本发明提供了一种存储效率达到最优、高效、高可靠性、易扩展的大数据存储解决方案。

    一种物联网终端数据高效存储系统

    公开(公告)号:CN110389725A

    公开(公告)日:2019-10-29

    申请号:CN201910681790.7

    申请日:2019-07-26

    Abstract: 本发明属于物联网技术领域,公开了一种物联网终端数据高效存储系统,用于解决物联网设备在异常状态时存在着数据丢失的问题。本发明通过搭建联网设备终端数据处理器和云端高效数据存储系统,实现物联网设备在安全与非安全环境下,安全高效的存储数据。同时对数据进行冷热划分,提高了数据的存储效率和访问速度。热数据程度越高的数据可以越快的被访问到,同时对冷数据进行编码存储,节约了系统存储空间。

    一种基于属性加权的朴素贝叶斯分类模型改进方法

    公开(公告)号:CN110222744A

    公开(公告)日:2019-09-10

    申请号:CN201910437156.9

    申请日:2019-05-23

    Abstract: 本发明公开了一种基于属性加权的朴素贝叶斯分类模型改进方法,涉及数据处理分类领域。本发明包括如下步骤:S1、数据预处理;S2、计算分组斯皮尔曼系数,剔除冗余属性,更新数据集;S3、求出各类的先验概率和类条件概率;S4、计算更新后的训练集每个属性的加权系数;S5、根据加权后的改进模型进行分类,并统计分类结果。本发明通过属性加权的方式有效的弱化了朴素贝叶斯分类模型的条件独立性假设,并且通过斯皮尔曼系数剔除了冗余属性,改进模型明显的提高了朴素贝叶斯模型的准确性和效率。

Patent Agency Ranking