一种基于机器学习的分布式查询系统及其优化方法

    公开(公告)号:CN116244610A

    公开(公告)日:2023-06-09

    申请号:CN202310332553.6

    申请日:2023-03-31

    Abstract: 本发明涉及一种基于机器学习的分布式查询系统及其优化方法。所述聚类模块,用于将系统中新产生的数据进行分析,得到聚类结果;所述数据分片存储模块,用于将收到的分片键范围将数据存储到对应的数据分片中,保证相似的数据被分配在同一个或者几个数据分片中;所述回归模块,用于配合数据缓存模块进行主动的数据缓存,预测数据未来的使用率,将使用率高的数据主动缓存到高速读取设备上;所述数据缓存模块,用于将预测的数据的未来访问率做一个排序,得到高使用率的数据所对应的分片键,之后向数据分片存储模块读取所对应的数据,将这个数据传递给数据缓存模块,数据缓存模块将接收到的数据存储到高速读取设备上。用以解决数据以分布式方式存储在磁盘上,它们之间的连接松散,使得查询更加困难的问题。

Patent Agency Ranking