-
公开(公告)号:CN112486687B
公开(公告)日:2022-09-27
申请号:CN202011396557.3
申请日:2020-12-03
Applicant: 重庆邮电大学
Abstract: 本发明涉及大数据处理技术和云平台资源负载技术领域,特别涉及一种基于多任务学习时间序列的云平台工作负载预测方法,包括获取工作负载数据,采用滑动窗口的方法划分数据,对划分的每个时间间隔的数据构建基础特征、交叉特征、时序趋势特征、用户行为关联特征,并采用二维SHAP进行特征选择;将选择的特征输入传入TCN‑LSTM模型中,采用多任务学习的方式,共有三个任务,分别为:预测T时间段的CPU平均利用率、预测T时间段的正在运行的作业数、预测T时间段的平均内存利用率;本发明通过对工作负载相关的指标的历史趋势进行把控,而不单一只关注当前监控点的工作负载情况,快速的感知业务的波峰波谷,从而对云平台的资源进行动态的调度。
-
公开(公告)号:CN110222416B
公开(公告)日:2022-08-23
申请号:CN201910486534.2
申请日:2019-06-05
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种基于大数据的工业蒸汽量预测方法,包括:101对锅炉的工况数据进行预处理操作;102根据工况数据的采集时间划分训练集数据、验证集数据;103建立多个机器学习模型,并进行模型融合操作;104通过建立的模型,根据锅炉传感器每分钟采集的工况数据对锅炉产生的蒸汽量进行预测。本发明主要是通过对锅炉工况数据进行预处理和分析,划分数据集,并利用已处理的工况数据建立多个机器学习模型,根据锅炉传感器每分钟采集的工况数据对锅炉产生的蒸汽量进行预测,为工业实时监测锅炉的燃烧效率提供服务。
-
公开(公告)号:CN112487291A
公开(公告)日:2021-03-12
申请号:CN202011362395.1
申请日:2020-11-28
Applicant: 重庆邮电大学
IPC: G06F16/9535 , G06F16/33 , G06F16/335 , G06N3/04 , G06N3/08
Abstract: 本发明涉及自然语言处理,特别涉及一种基于大数据的个性化新闻推荐方法及系统,所述方法包括获取历史数据,对数据集进行预处理操作,并进行预处理;对数据构建特征工程,建立用户属性特征、用户时序特征、新闻属性特征、上下文属性特征以及新闻标题语义特征;根据特征的重要性对特征进行选择,保留重要性最高的前50%的特征作为选择的特征;根据选择的特征建立深度学习模型并进行模型融合操作,利用该模型对实时数据进行预测,将预测的点击率大于0.75的新闻推荐给用户;本发明可以对海量特征进行有效地特征选择,在保证效果的前提下,能减小特征维度,加快模型的训练时间,提高效率,同时降低对内存的要求。
-
公开(公告)号:CN112487145A
公开(公告)日:2021-03-12
申请号:CN202011383623.3
申请日:2020-12-01
Applicant: 重庆邮电大学
Abstract: 本发明涉及自然语言处理技术领域,具体涉及一种O2O商铺食品安全监测方法,包括:采用主动学习算法对用户历史评论文本数据进行标注,得到标注样本集L;根据标注样本集L构建词向量;将标注样本集L和词向量输入AT‑GRU模型中进行深度学习,输出店铺是否存在安全隐患以及具体的安全隐患;将标注样本集L输入ELECTRA模型进行微调,得到较精确的预测结果。本发明使用了预训练模型ELECTRA进行微调,不仅可以找到有食品安全隐患的店铺,并且使用基于注意力机制的AT‑GRU模型,可以进行细粒度预测,自动化地提取出具体的食品安全隐患。
-
公开(公告)号:CN112486687A
公开(公告)日:2021-03-12
申请号:CN202011396557.3
申请日:2020-12-03
Applicant: 重庆邮电大学
Abstract: 本发明涉及大数据处理技术和云平台资源负载技术领域,特别涉及一种基于多任务学习时间序列的云平台工作负载预测方法,包括获取工作负载数据,采用滑动窗口的方法划分数据,对划分的每个时间间隔的数据构建基础特征、交叉特征、时序趋势特征、用户行为关联特征,并采用二维SHAP进行特征选择;将选择的特征输入传入TCN‑LSTM模型中,采用多任务学习的方式,共有三个任务,分别为:预测T时间段的CPU平均利用率、预测T时间段的正在运行的作业数、预测T时间段的平均内存利用率;本发明通过对工作负载相关的指标的历史趋势进行把控,而不单一只关注当前监控点的工作负载情况,快速的感知业务的波峰波谷,从而对云平台的资源进行动态的调度。
-
公开(公告)号:CN110222416A
公开(公告)日:2019-09-10
申请号:CN201910486534.2
申请日:2019-06-05
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种基于大数据的工业蒸汽量预测方法,包括:101对锅炉的工况数据进行预处理操作;102根据工况数据的采集时间划分训练集数据、验证集数据;103建立多个机器学习模型,并进行模型融合操作;104通过建立的模型,根据锅炉传感器每分钟采集的工况数据对锅炉产生的蒸汽量进行预测。本发明主要是通过对锅炉工况数据进行预处理和分析,划分数据集,并利用已处理的工况数据建立多个机器学习模型,根据锅炉传感器每分钟采集的工况数据对锅炉产生的蒸汽量进行预测,为工业实时监测锅炉的燃烧效率提供服务。
-
公开(公告)号:CN110060102A
公开(公告)日:2019-07-26
申请号:CN201910313789.9
申请日:2019-04-18
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种基于偏标记学习的用户所在商铺定位大数据预测方法,包括:101对用户的购物状态数据进行预处理操作;102根据每个样本所对应的候选商铺集合构建偏标记数据集;103对偏标记数据集进行特征提取操作;104根据特征空间构建相似度图;105根据相似度图进行概率传播;106通过传播所收敛的概率,从偏标记数据集的候选商铺集合中预测出用户未来有行为互动的商铺。本发明主要是通过对用户历史数据进行预处理,提取特征,转换偏标记数据集,建立偏标记学习模型,根据用户的位置行为的偏标记数据集,从每个用户所对应的候选商铺集合中预测出用户未来有行为互动的商铺,使得用户能够获得更为精准的个性化推送服务,提高用户的购物体验。
-
公开(公告)号:CN110059183A
公开(公告)日:2019-07-26
申请号:CN201910221691.0
申请日:2019-03-22
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种基于大数据的汽车行业用户观点情感分类方法,包括101对数据进行预处理操作;102对数据进行特征工程构建操作;103建立多个机器学习模型包括LightGBM、随机森林、Catboost模型,并进行模型融合操作;104通过已建立的模型,根据文本内容、主题、情感分析等数据了解消费者。本发明主要是通过对文本内容、主题、情感分析等数据进行预处理、Jieba分词和分析数据提取特征,建立多个机器学习模型,从而预测汽车行业用户的情感,使得汽车厂商获得快速、准确的方式来了解消费者需求,使得汽车厂商能够根据消费者对汽车的情感对汽车做最有效的改进。
-
公开(公告)号:CN109784979A
公开(公告)日:2019-05-21
申请号:CN201811555230.9
申请日:2018-12-19
Applicant: 重庆邮电大学
IPC: G06Q30/02
Abstract: 本发明公开了一种大数据驱动的供应链需求预测方法,包括:101对商品数据进行数据预处理操作;102根据商品历史销售数据划分数据集;103对划分的数据集进行特征工程构建操作;104对构建的特征进行特征选择;105建立机器学习模型,并进行模型融合操作;106通过构建的模型,预测商品未来一周的销量。本发明主要通过对商品在用户的表现数据、商品信息、商品销售数据、商品sku映射表、商品促销价格表和平台活动时间表进行预处理和分析提取特征,建立机器学习模型并进行线性加权模型融合,从而准确预测商品未来一周的销量,为供应链提供数据基础和企业建立全球化供应链方案提供关键的技术支持。
-
-
-
-
-
-
-
-