-
公开(公告)号:CN106886569B
公开(公告)日:2020-05-12
申请号:CN201710026254.4
申请日:2017-01-13
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种基于MPI的ML‑KNN多标签中文文本分类方法,涉及文本分类和机器学习中的多标签分类算法。为解决ML‑KNN算法在具体实现中大规模文本分类问题和求解优化问题,控制计算的时间和空间的开销,本发明采用的技术方案是,采用MPI编程实现中文文本数据的预处理、特征提取、ML‑KNN算法及分类的并行化。相比传统的串行多标签中文文本分类方法,本发明极大的提高了多标签中文文本分类的效率。同时,在数据量一定的情况下,算法的效率一般会随着计算资源(进程数)的增加而增加。值得一提的是,在基于MPI并行化ML‑KNN步骤中,对数据集进行划分时既可以以样本为单位划分,又可以以特征为单位划分,这使得本发明在处理高维文本数据的时候,具有更大的优势。
-
公开(公告)号:CN110084412A
公开(公告)日:2019-08-02
申请号:CN201910294213.2
申请日:2019-04-12
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种基于特征转换多标签学习的光伏发电大数据预测方法,包括:101对数据进行预处理操作;102根据历史数据根据时间划分训练集数据和验证集数据;103对光伏电站历史数据进行特征工程操作;104对构建特征完成的数据集进行基于AUC最大值的特征选择;105建立多个机器学习模型,构建基于特征转换多标签学习的算法模型;106基于特征转换多标签学习的算法模型,根据光伏电站数据精准预测光伏板的发电情况。本发明根据光伏电站历史数据来对光伏板在未来一周的每一天是否会发电达标进行预测,有效保障光伏板本体性能,从而为国家电投提供数据支撑与决策支持。
-
公开(公告)号:CN110083802A
公开(公告)日:2019-08-02
申请号:CN201910293785.9
申请日:2019-04-12
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种基于多目标回归的高速公路收费站车流量大数据预测方法,包括:101对数据进行预处理操作;102对数据进行打标操作;103对数据进行特征工程构建操作;104构建一种结合目标特定特征和目标相关性的多目标回归模型;105通过已建立的模型,根据收费站历史车流量数据、天气数据等信息,预测收费站8点到10点每20分钟的车流量。本发明主要是通过对收费站历史车流量数据、天气数据等信息进行预处理和分析提取特征,建立一种结合目标特定特征和目标相关性的多目标回归模型,预测收费站8点到10点每20分钟的车流量,从而使交通管理部门能够利用大数据及时采取措施减少收费站的拥堵。
-
公开(公告)号:CN109784997A
公开(公告)日:2019-05-21
申请号:CN201910027207.0
申请日:2019-01-11
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种基于大数据的短视频活跃用户预测方法,包括:101对用户的历史行为数据进行预处理操作;102根据注册时间将用户划分成训练集候选用户和测试集候选用户103将训练集候选用户和测试集候选用户根据历史行为转化为时序序列,作为训练集和测试集;104对处理好的时序序列进行打标;105通过时序序列建立many-to-many结构的LSTM模型;106根据用户历史行为时间序列,对当月注册用户在未来一周是否会使用相应短视频APP进行预测。本发明主要是通过对用户历史数据进行预处理和分析,提取特征,转换时序序列工作,建立深度学习模型,对当月注册用户在未来一周是否会使用该短视频APP进行预测,为短视频领域寻找活跃用户提供更为精准的个性化推送服务。
-
公开(公告)号:CN109559059A
公开(公告)日:2019-04-02
申请号:CN201811542570.8
申请日:2018-12-17
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种基于回归决策树的光纤生产规则制定方法,属于机器学习、大数据处理技术领域,具体包括步骤:101收集光纤生产过程中的光棒数据和光纤数据并对光棒数据和光纤数据进行预处理操作;102对光棒数据进行特征工程构建操作;103建立决策树回归模型;104通过交叉验证对模型进行调优;105根据决策树分裂的路径获得光纤生产规则。本发明主要是通过对光纤生产过程中的光棒数据和光纤数据进行预处理和分析提取特征,建立决策树回归模型,并对模型进行优化,通过决策树分裂的路径获取光纤生产的规则。
-
公开(公告)号:CN109462877A
公开(公告)日:2019-03-12
申请号:CN201811363906.4
申请日:2018-11-16
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种基于模糊逻辑的WSNs能量中性分簇路由方法,属于通信领域。该方法包括以下步骤:步骤1)将马尔科夫链模型引入能量收集预测过程,根据获取能量预测进行能量中性约束;步骤2)构建动态簇头集群机制保证了整个网络的持久运行;步骤3)通过最大化网络数据吞吐量利用凸优化得到最优分簇数量;步骤4)Type-2模糊逻辑推理系统的设计;步骤5)传感器节点广播竞争当选簇头,簇头节点收集数据融合后传给基站;本发明通过能量中性约束能够保持网络持久运行,Type-2模糊逻辑系统提升了簇头选取合理性,同时提升了网络吞吐量,延长了网络生存周期。
-
公开(公告)号:CN109255506A
公开(公告)日:2019-01-22
申请号:CN201811401139.1
申请日:2018-11-22
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种基于大数据的互联网金融用户贷款逾期预测方法,包括:101数据预处理操作:根据用户行为、用户基本信息、信用评分数据预处理操作;102根据七折交叉验证法对数据进行划分操作;103根据对抗网络生成模型扩展训练集;104根据用户行为、用户基本信息、信用评分数据进行特征工程构建操作;105建立4个机器学习模型,并进行线性回归模型融合操作;106通过已建立模型基础,根据用户基本信息设置人工阈值规则预测用户是否违约。本发明运用大数据实现互联网金融风险机构由传统“事后堵截”的手段转变为“预先识别”,识别高违约用户。
-
公开(公告)号:CN109034658A
公开(公告)日:2018-12-18
申请号:CN201810960445.2
申请日:2018-08-22
Applicant: 重庆邮电大学
CPC classification number: G06Q10/0635 , G06Q40/00
Abstract: 本发明公开了一种基于大数据金融的违约用户风险预测方法,包括:101对用户的历史行为数据进行预处理操作;102根据历史行为划分训练集数据、验证集数据;103对用户历史数据进行特征工程操作;104对构建特征完成的样本集进行特征选择;105建立多个机器学习模型,并进行模型融合操作;106通过建立的模型,根据用户历史行为数据对用户在未来一个月是否会逾期还款进行预测。本发明主要是通过对用户历史数据进行预处理和分析,提取特征,特征选择工作,建立多个机器学习模型,根据用户互联网消费行为数据对用户在未来一个月是否会逾期还款进行预测,为金融领域细分人群提供更为精准的风控服务。
-
公开(公告)号:CN107944913A
公开(公告)日:2018-04-20
申请号:CN201711164670.7
申请日:2017-11-21
Applicant: 重庆邮电大学
CPC classification number: G06Q30/0202 , G06K9/6218 , G06K9/6228 , G06Q30/0201
Abstract: 本发明请求保护一种基于大数据用户行为分析的高潜在用户购买意向预测方法,包括:101数据预处理,对电商用户历史行为数据集进行预处理操作;102样本定义与打标,根据用户历史消费行为,以有交互的用户产品对为关键字构建样本;103训练集测试集划分,采用时间窗口划分法,将历史数据划分为训练集与测试集;104特征构建,对用户的历史行为数据进行特征工程构建;105算法设计与实现,首先对特征群特征选择和对数据集进行不平衡数据的处理,随后本发明提出一种两层模型迭代学习算法预测最终结果。本发明基于时间跨度45天的电商用户历史行为数据,建立预测模型,从而预测未来5天用户是否下单候选商品集合P中的商品。
-
公开(公告)号:CN107909433A
公开(公告)日:2018-04-13
申请号:CN201711121288.8
申请日:2017-11-14
Applicant: 重庆邮电大学
CPC classification number: G06Q30/0631 , G06K9/629 , G06Q30/0202
Abstract: 本发明请求保护一种基于大数据移动电子商务的商品推荐方法,包括:101对用户的历史行为数据进行预处理操作;102根据行为时间对用户历史数据进行数据划分操作;103对用户历史行为数据打标;104对用户历史数据进行特征工程构建操作;105建立多个机器学习模型,并进行模型融合操作;106通过已建立的模型,根据用户行为数据对用户在未来一天是否购买某商品进行预测。本发明主要是通过对用户历史数据进行预处理和分析提取特征,建立多个机器学习模型,从而预测用户在未来一天中购买某商品的概率,提高商家给用户推荐商品的精度。
-
-
-
-
-
-
-
-
-