-
公开(公告)号:CN110059183A
公开(公告)日:2019-07-26
申请号:CN201910221691.0
申请日:2019-03-22
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种基于大数据的汽车行业用户观点情感分类方法,包括101对数据进行预处理操作;102对数据进行特征工程构建操作;103建立多个机器学习模型包括LightGBM、随机森林、Catboost模型,并进行模型融合操作;104通过已建立的模型,根据文本内容、主题、情感分析等数据了解消费者。本发明主要是通过对文本内容、主题、情感分析等数据进行预处理、Jieba分词和分析数据提取特征,建立多个机器学习模型,从而预测汽车行业用户的情感,使得汽车厂商获得快速、准确的方式来了解消费者需求,使得汽车厂商能够根据消费者对汽车的情感对汽车做最有效的改进。
-
公开(公告)号:CN106875670B
公开(公告)日:2019-12-31
申请号:CN201710131675.3
申请日:2017-03-07
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种Spark平台下基于GPS数据的出租车调配方法,包括:101从调度中心获取出租车历史GPS数据部署到Spark平台上,对数据做并行地预处理操作;102在Spark平台下对出租车历史GPS数据进行分析,提取特征建立回归模型;103在Spark平台下对出租车的实时GPS数据进行提取并预测其未来的路径、终点位置以及到达时间;104根据预测结果对出租车的调配进行优化。本发明主要是在Spark平台下解决出租车调配问题,通过对出租车历史GPS数据的分析,提取特征建立回归模型,从而预测出租车未来的GPS路径、终点位置以及到达时间,继而对出租车的调配进行优化。
-
公开(公告)号:CN107067025A
公开(公告)日:2017-08-18
申请号:CN201710081921.9
申请日:2017-02-15
Applicant: 重庆邮电大学
IPC: G06K9/62
Abstract: 本发明请求保护一种基于主动学习的数据自动标注方法,属于主动学习领域,包括以下步骤:101对已标记和未标记数据进行处理;102利用多个不同分类器对未标记数据进行分类;103选出分歧熵低的数据;104对分歧熵低的数据进行人工标记;105对人工标记结果进行自检。本发明针对如何在减少人工标注数据的数量的同时,尽量保证人工标注数据的准确性问题,通过结合主动学习方法发明一个附带自检功能的数据自动标注系统,达到缩减工作量且提高人工标注数据准确性的目的。
-
公开(公告)号:CN119226674A
公开(公告)日:2024-12-31
申请号:CN202411248315.8
申请日:2024-09-06
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种基于三段式CORDIC算法的复乘单元的FFT硬件加速电路,属于无线通信电路领域。该电路包括地址产生单元、随机存储单元、旋转角度产生单元、基于三段式CORDIC算法的复乘单元、基四蝶形单元、输出处理单元和倒序单元。其中,基于三段式CORDIC算法的复乘单元采用流水线结构,将迭代过程分为三个阶段,利用ROM表存储预先计算好的迭代结果,并通过角度二极化编码和移位相加操作实现复数乘法运算。与传统的FFT算法相比,本发明具有运算速度快、存储压力小、资源消耗少等优点,适用于无线通信、图像处理等领域的信号处理任务。旨在解决传统FFT算法计算量大、存储压力大、运算缓慢和资源消耗大的问题。
-
公开(公告)号:CN118114733A
公开(公告)日:2024-05-31
申请号:CN202410271960.5
申请日:2024-03-11
Applicant: 重庆邮电大学
IPC: G06N3/08 , G06N3/063 , G06N3/0442 , G06N3/049
Abstract: 本发明涉及一种基于脉动阵列的LSTM前向传播加速方法,属于神经网络加速技术领域。在传统二维脉动阵列结构中,输入矩阵X的每一行与权重矩阵W的每一列都要进行相乘再累加的操作,实现数据的高度复用。但循环神经网络中存在大量的大规模矩阵向量乘运算,无法利用高数据复用率的传统脉动阵列结构进行运算和加速,因此,本发明引入了一种基于脉动阵列的前向传播加速方法,充分了利用硬件资源,结合脉动阵列结构,减小了计算所需带宽和访存次数,并优化了脉动阵列中各个PE的计算时间,从而缩短整体的硬件工作时间,最大化利用脉动阵列实现LSTM的加速效果。
-
公开(公告)号:CN107086935B
公开(公告)日:2020-05-12
申请号:CN201710457666.3
申请日:2017-06-16
Applicant: 重庆邮电大学
Abstract: 本发明涉及基于WIFI AP记录的机场客流分布预测方法,涉及大数据挖掘处理技术领域,从控制中心获取WIFI AP记录进行预处理操作,通过WIFI AP接入设备数量分类WIFI AP,为各类WIFI AP分别构建训练样本集,使用各自的训练样本集分别构建回归模型,根据回归模型获取测试样本集,集合第一类模型和第二类模型的测试样本集获得预测结果,预测机场客流分布。本发明利用相关特性,使用数据挖掘及机器学习的相关方法,对机场的客流分布进行预测,达到有效利用机场资源。
-
公开(公告)号:CN106886569B
公开(公告)日:2020-05-12
申请号:CN201710026254.4
申请日:2017-01-13
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种基于MPI的ML‑KNN多标签中文文本分类方法,涉及文本分类和机器学习中的多标签分类算法。为解决ML‑KNN算法在具体实现中大规模文本分类问题和求解优化问题,控制计算的时间和空间的开销,本发明采用的技术方案是,采用MPI编程实现中文文本数据的预处理、特征提取、ML‑KNN算法及分类的并行化。相比传统的串行多标签中文文本分类方法,本发明极大的提高了多标签中文文本分类的效率。同时,在数据量一定的情况下,算法的效率一般会随着计算资源(进程数)的增加而增加。值得一提的是,在基于MPI并行化ML‑KNN步骤中,对数据集进行划分时既可以以样本为单位划分,又可以以特征为单位划分,这使得本发明在处理高维文本数据的时候,具有更大的优势。
-
公开(公告)号:CN107092644A
公开(公告)日:2017-08-25
申请号:CN201710131434.9
申请日:2017-03-07
Applicant: 重庆邮电大学
CPC classification number: G06F17/3071 , G06F17/277 , G06K9/6215 , G06K9/6269 , G06K9/628
Abstract: 本发明公开了一种基于MPI和Adaboost.MH的中文文本分类方法,用于解决当数据量较大时,Adaboost.MH训练时间较长因而导致总的中文文本分类时间较长的问题。该方法包括:将经过分词处理的中文文本保存到训练数据集,然后将互信息方法与MPI相结合,实现特征词选择,然后所有进程通过MPI中的MPI_Reduce函数进行归约求和进而求得相似度,根据相似度的大小选择特征词。接着每个进程根据其所包含的中文文本中选择的特征词是否存在来给特征词赋予权值。然后根据MPI的通信函数将进程计算结果进行整合得到文本分类模型,利用分类模型对待分类的中文文本分类。本发明极大地缩短了对中文文本进行分类的时间。
-
公开(公告)号:CN118886465A
公开(公告)日:2024-11-01
申请号:CN202410997080.6
申请日:2024-07-24
Applicant: 重庆邮电大学
IPC: G06N3/063 , G06N3/0442
Abstract: 本发明涉及一种基于分布式计算脉动阵列的轻量化LSTM硬件加速器及加速方法,属于循环神经网络加速器领域。该加速器包括控制模块、重构模块、激活模块和多个脉动阵列,控制模块负责全局调配,尤其是实现在脉动阵列中将权重数据与输入数据耦合相乘;重构模块通过将输入的单个数据缓存并维度重构,使其符合脉动阵列的输入维度;脉动阵列负责实现4个门和全连接层的运算,其中通过脉动的方式传递并计算数据,以减少计算单元的空置率并提高计算效率;本发明在对LSTM网络进行训练时,采用分层分模块轻量化重训练,在使权重参数规模减少的同时保持准确率,本发明提出的LSTM加速器相对于通用处理器具有高能效、高算力的特点。
-
公开(公告)号:CN110059183B
公开(公告)日:2022-08-23
申请号:CN201910221691.0
申请日:2019-03-22
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种基于大数据的汽车行业用户观点情感分类方法,包括101对数据进行预处理操作;102对数据进行特征工程构建操作;103建立多个机器学习模型包括LightGBM、随机森林、Catboost模型,并进行模型融合操作;104通过已建立的模型,根据文本内容、主题、情感分析等数据了解消费者。本发明主要是通过对文本内容、主题、情感分析等数据进行预处理、Jieba分词和分析数据提取特征,建立多个机器学习模型,从而预测汽车行业用户的情感,使得汽车厂商获得快速、准确的方式来了解消费者需求,使得汽车厂商能够根据消费者对汽车的情感对汽车做最有效的改进。
-
-
-
-
-
-
-
-
-