-
公开(公告)号:CN105574547A
公开(公告)日:2016-05-11
申请号:CN201510974685.4
申请日:2015-12-22
Applicant: 北京奇虎科技有限公司 , 重庆邮电大学
Abstract: 一种自适应动态调整基分类器权重的集成学习方法及装置,其中方法包括:构建多个基分类器;基于多个所述基分类器,对采集到的训练样本进行聚类;确定各个所述基分类器对聚类后的训练样本的各个簇的适应度;计算所述测试样本与聚类后的训练样本各个簇的相似度;对所述适应度和所述相似度进行整合,得到每个所述测试样本针对各个所述基分类器相适应的权重,并将多个所述权重组合为一个强分类器;装置包括:构建模块、聚类模块、适应度确定模块、相似度计算模块以及组合模块。本发明通过结合聚类算法,并考虑测试样本与基分类器的适应性,动态地对基分类器进行权重赋值,可有效提高分类器的泛化能力和分类精确率。
-
公开(公告)号:CN109040139B
公开(公告)日:2021-05-18
申请号:CN201811186828.5
申请日:2018-10-12
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种基于区块链与智能合约的身份认证方法,主要包括如下模块:独立于区块链的用户认证模块,负责在两个节点之间进行用户的身份认证;区块链模块,其于存储整个用户身份认证过程的加密编码与其他相关认证信息;智能合约模块,其作用是在用户身份认证完成之后将整个认证过程进行RSA算法加密后存入区块链中。本发明利用区块链公开、去中心化、防篡改的特性,可以很好的解决身份联盟之间的用户认证过程中可能产生的隐私泄露、伪造认证信息和认证后抵赖的问题。
-
公开(公告)号:CN107067283B
公开(公告)日:2021-05-18
申请号:CN201710267098.0
申请日:2017-04-21
Applicant: 重庆邮电大学
IPC: G06Q30/02
Abstract: 本发明请求保护一种基于历史商家记录及用户行为的电商消费客流量预测方法,涉及计算机信息获取和机器学习技术。本发明通过读取商家的历史电商消费记录及用户的浏览消费记录,并进行数据预处理操作。然后对数据集进行提取添加新特征,通过建立一种时间序列的回归模型,最后进行预测未来每天通过电商消费客流量。本发明利用商家电商记录特性,对未来每天使用电商消费客流量进行预测,商家可以优化运营,降低成本,并改善用户体验。
-
公开(公告)号:CN109242552B
公开(公告)日:2020-09-29
申请号:CN201810961118.9
申请日:2018-08-22
Applicant: 重庆邮电大学
Abstract: 本发明公开了一种基于大数据的商铺定位方法,包括:101对数据进行预处理操作;102根据记录时间对数据进行划分操作;103根据一定规则构建每条样本的候选集;104对数据进行打标操作;105对数据进行特征工程构建操作;106建立多个机器学习模型,并进行模型融合操作;107通过已建立的模型,根据用户的经纬度、所连接的WiFi信息等数据定位用户所在商铺。本发明主要是通过对用户的经纬度、所连接的WiFi信息等数据进行预处理和分析提取特征,建立多个机器学习模型,从而定位用户当前所在商铺,使得商家能够在在正确的时间、正确的地点给用户最有效的服务。
-
公开(公告)号:CN106570178B
公开(公告)日:2020-09-29
申请号:CN201610991719.5
申请日:2016-11-10
Applicant: 重庆邮电大学
IPC: G06F16/35
Abstract: 本发明请求保护一种基于图聚类的高维文本数据特征选择方法,该方法包括:剔除不相关特征,并构造加权无向图;再结合社区发现算法快速地将特征聚类;并以“最大相关最小冗余”原则搜索类簇空间,剔除类簇内的冗余特征;最后根据特征与类别间的关系挑选出最佳特征子集。本发明旨在利用图能体现特征空间分布的特性,结合高效的社区发现进行特征聚类,选取出具有代表性的特征,并消除聚类过程中忽略数据分布情况和每个特征与类别都具有不同程度的重要性问题。同时解决聚类时的盲目性,使得文本分类结果具有更高的准确性和稳定性。
-
公开(公告)号:CN109165284B
公开(公告)日:2020-06-16
申请号:CN201810961117.4
申请日:2018-08-22
Applicant: 重庆邮电大学
IPC: G06F16/332 , G06F40/289
Abstract: 本发明公开了一种基于大数据的金融领域人机对话意图识别方法,包括:101对金融领域人机对话所产生的文本数据的预处理;102对于给定文本数据集进行划分;103根据人机对话的数据进行文本数据特征的构建,包括特征提取,文本向量化;104针对构建完成后的特征,进行降维,稀疏处理;105针对文本数据,建立机器学习模型,来对未知的人机对话进行意图识别。本发明提出利用机器学习来对文本数据进行预测,对已知标签的文本数据训练而得到模型,来预测未知标签的文本数据(该问题属于多分类问题),从而获取该对话所表达的意图(多分类概率最大的概率)。
-
公开(公告)号:CN106875670B
公开(公告)日:2019-12-31
申请号:CN201710131675.3
申请日:2017-03-07
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种Spark平台下基于GPS数据的出租车调配方法,包括:101从调度中心获取出租车历史GPS数据部署到Spark平台上,对数据做并行地预处理操作;102在Spark平台下对出租车历史GPS数据进行分析,提取特征建立回归模型;103在Spark平台下对出租车的实时GPS数据进行提取并预测其未来的路径、终点位置以及到达时间;104根据预测结果对出租车的调配进行优化。本发明主要是在Spark平台下解决出租车调配问题,通过对出租车历史GPS数据的分析,提取特征建立回归模型,从而预测出租车未来的GPS路径、终点位置以及到达时间,继而对出租车的调配进行优化。
-
公开(公告)号:CN110322962A
公开(公告)日:2019-10-11
申请号:CN201910594042.5
申请日:2019-07-03
Applicant: 重庆邮电大学
Abstract: 本发明属于计算机技术领域,一种自动生成诊断结果的方法、系统及计算机设备,所述方法包括采集病例的病史小结,并对病史小结进行预处理;将预处理后的语料构建预训练词向量模型Word2Vec,得到向量表示的语料;构建神经网络结构,并将向量表示的预料输入该神经网络,其中该神经网络结构包括双向门控循环单元BiGRU、卷积神经网络卷积神经网络CNN和注意力机制Att;设置阈值来选择神经网络输出的多分类概率矩阵中的标签,选择的标签即为诊断结果;本发明相比于传统的词袋模型,能够提取更多的特征且更有效;最后设置阈值来处理多标签问题,并且加上相关性约束,解决诊断结果的冲突,使得结果的生成也更为合理。
-
公开(公告)号:CN109543756A
公开(公告)日:2019-03-29
申请号:CN201811417152.6
申请日:2018-11-26
Applicant: 重庆邮电大学
IPC: G06K9/62
Abstract: 本发明请求保护一种基于主动学习的标签查询与更改方法,属于主动学习领域。包括步骤:首先利用10折交叉验证的方法和强弱分类算法训练多个分类模型;然后计算残差矩阵和置信度矩阵,其次将得到的两个新的矩阵横向拼接为一个矩阵,作为特征矩阵;再利用K-means算法对生成的特征矩阵进行聚类,根据阈值得到A,B,C,D四种类型的类簇;最后对疑似噪声的类簇(A类型和C类型)采用主动学习的方法重新标注部分样本,根据标注结果得到最终的噪声类簇;并将噪声类簇的样本标签修正为正确标签,将修正后的A,C类样本与B,D类样本合并为最终的训练样本集。本发明具有极好的筛选出标签噪声的效果,可以减少人工标记带来的代价,以非常小的主动学习代价获取更高的分类正确率。
-
公开(公告)号:CN107332848A
公开(公告)日:2017-11-07
申请号:CN201710542877.7
申请日:2017-07-05
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种基于大数据的网络流量异常实时监测的系统,使用了一种解耦合的系统设计,数据采集,数据处理,数据分析与及时响应自成一体,系统高度模块化。其特征在于:用嗅探器进行了数据的分布式采集,实现全网监测,实时抓取网络数据包信息。根据URL结构设定了特定规则,构建数据处理模块,实现对URL的有效信息提取。大量URL数据输入到利用bagging集成的机器学习器中进行有监督式学习,得到能够识别URL类型的数据分析模块;Web端与移动客户端的结合以多角度,多层次呈现数据。安装在服务器上的防御插件实现了对服务器的及时防护,与此同时,实时更新系统分类器数据,提高系统实用性。
-
-
-
-
-
-
-
-
-