-
公开(公告)号:CN107665291B
公开(公告)日:2020-05-22
申请号:CN201710886300.8
申请日:2017-09-27
Applicant: 华南理工大学
IPC: G16B20/50
Abstract: 本发明公开了一种基于云计算平台Spark的变异检测方法,包括步骤:1)Spark主节点截取部分的输入序列比对映射格式文件,分发到各个Spark工作节点中;2)Spark工作节点并行对上述的片段序列比对映射格式文件进行预处理,获取片段的预处理信息并返回到Spark主节点;3)Spark主节点根据上述的预处理信息对输入序列比对映射格式文件进行自定义粒度划分,并分发到各个Spark工作节点;4)Spark工作节点对片段序列比对映射格式文件进行变异检测,Spark主节点接收所有工作节点的返回数据并写入文件。本发明能有效解决HaplotypeCaller变异检测方法不能适应于多节点环境情景或者在多节点时负载不均衡的问题。
-
公开(公告)号:CN108009566B
公开(公告)日:2020-04-28
申请号:CN201711098745.6
申请日:2017-11-09
Applicant: 华南理工大学
Abstract: 本发明公开了一种时空窗口下的改进型PCA损伤检测方法,首先,利用数值仿真或者实验手段,在损伤处于不同空间位置的多种工况下,确定不同位置损伤所对应的空间影响范围,进而确定对损伤敏感的结构空间区域,即空间窗口;其次,依据PCA原理确定与外荷载周期有关的时间窗口;最后在确定时间窗口和空间窗口后,对空间窗口内所有测点数据使用PCA方法,以特征向量作为监测指标,实时监测损伤并实现损伤定位。本发明方法是在限定的时间和空间窗口内对结构响应进行PCA分析,从而提高了损伤识别的精度和灵敏度,可利用长期结构监测数据对大跨度实体桥梁或其它结构进行损伤识别。
-
公开(公告)号:CN110223106A
公开(公告)日:2019-09-10
申请号:CN201910417277.7
申请日:2019-05-20
Applicant: 华南理工大学
IPC: G06Q30/02
Abstract: 本发明公开了一种基于深度学习的欺诈应用检测方法,包括步骤:1)获取移动广告数据,进行预处理;2)提取结构数据和样本数据;3)基于结构数据构建图并获取图嵌入特征,基于样本数据构建应用二维数据单元;4)所有应用的数据单元和图嵌入特征纵向拼接构建应用基本属性特征矩阵和图嵌入特征矩阵,构成输入特征;5)定义标签,构成被试数据;6)构建混合卷积神经网络,用于欺诈检测;7)被试数据输入至混合卷积神经网络中训练,得到混合卷积神经网络模型;8)采用混合卷积神经网络模型进行欺诈检测。本发明能够同时考虑应用的结构特征和基本属性特征,有效提高欺诈应用检测的准确率,同时减少移动广告历史数据特征工程的工作量。
-
公开(公告)号:CN109829018A
公开(公告)日:2019-05-31
申请号:CN201910078950.9
申请日:2019-01-28
Applicant: 华南理工大学 , 中国移动通信集团广西有限公司
IPC: G06F16/28
Abstract: 本发明公开了一种基于深度学习的移动客户超细分方法,包括步骤:S1、对移动用户的基础数据和消费行为数据进行预处理;S2、针对消费行为特征,统计第一用户集(这类移动用户拥有大于或等于t个月的消费行为数据)中每个用户的该特征的t个月数据的平均值等作为该特征的统计特征;S3、将处理后的两类特征拼接,作为特征向量;S4、构建自动编码器,获得特征向量的低维向量表示;S5、构建层次聚类模型,进行层次聚类;S6、对于第二用户集(这类移动用户拥有小于t个月的消费行为数据),通过计算与聚类后各簇心的距离获得相应的细分类别。本发明可以对大规模移动客户数据实现快速细分,根据客户细分结果,可以针对性地进行套餐推荐等个性化服务。
-
公开(公告)号:CN109787821A
公开(公告)日:2019-05-21
申请号:CN201910006654.8
申请日:2019-01-04
Applicant: 华南理工大学 , 中国移动通信集团广西有限公司
Abstract: 本发明公开了一种大规模移动客户流量消费智能预测方法,包括步骤:1)收集移动用户属性特征和消费行为数据,可视化,并进行预处理;2)构造分类预测器与回归预测器,进行训练,得到两个不同尺度的预测模型;3)联合分类预测器与回归预测器为可训练的线性组合,进行第二阶段训练,得到联合预测模型;4)使用联合预测模型,根据移动用户的属性特征和消费行为预测该用户下个月的流量消费值。本发明将分类预测器与回归预测器联合起来,在大规模移动用户数据上进行双阶段的训练,使所得到的联合流量预测模型具有更高的准确度和鲁棒性,从而为移动业务推广提供更精准有效的营销思路。
-
公开(公告)号:CN109272332A
公开(公告)日:2019-01-25
申请号:CN201810870865.1
申请日:2018-08-02
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于递归神经网络的客户流失预测方法,包括:(1)获取客户数据并对数据进行预处理;(2)将同一个客户T个时间单位的一行特征,按时间倒序依次排列,组成一个T行特征构成的二维数据单元;(3)将所有用户的T行二维数据,构成模型的输入特征矩阵;(4)定义标签,构成被试数据;(5)构建混合递归神经网络,预测客户的流失;(6)将模型训练部分的客户数据经过步骤(1)-(4)的处理后输入至所述混合递归神经网络中进行模型训练,得到混合递归神经网络模型;(7)采用混合递归神经网络模型对客户进行流失预测。本发明能够有效提高客户流失预测的准确率,同时减少客户历史数据特征工程的工作量。
-
公开(公告)号:CN108710651A
公开(公告)日:2018-10-26
申请号:CN201810431307.5
申请日:2018-05-08
Applicant: 华南理工大学
CPC classification number: G06F17/277 , G06N3/0454 , G06Q30/01
Abstract: 本发明公开了一种大规模客户投诉数据自动分类方法,包括以下步骤:收集投诉文本数据,并进行预处理;构建第一投诉分类器和第二投诉分类器;根据过滤规则,满足过滤规则分配第一分类标签;不满足过滤规则使用第一投诉分类器进行分类;有第一分类标签的投诉文本数据,没有对应第二投诉分类器,且第一分类标签条目大于第一门限值,则增加一个第二投诉分类器,进行再分类,得到第二分类标签;有对应第二投诉分类器,进行再分类,得到第二分类标签;本发明构建分类器,将投诉文本数据转化为向量,进行分类,通过生成特征词表和TF‑IDF权重值进行聚类和再分类,从而对投诉文本数据进行多层分类,实现快速而准确的对投诉数据文本进行分类。
-
公开(公告)号:CN107577805A
公开(公告)日:2018-01-12
申请号:CN201710881202.5
申请日:2017-09-26
Applicant: 华南理工大学
IPC: G06F17/30
Abstract: 本发明公开了一种面向日志大数据分析的业务服务系统,包括日志获取模块、数据预处理模块、数据管道模块、计算处理模块、存储查询模块、系统管理模块,对数据计算、数据存储的方式进行系统化封装,在日志数据分析领域,在各种需进行数据处理、分析、展示等场景应用的接入及数据管理上,形成在数据和业务上易于横向扩展、具有多种大数据计算模式适配的大数据服务系统。采用多模块设计方式,通过关键中间服务的统一管理,结合系统架构中分布式计算和存储组件,为用户通过数据快速处理与分析、业务应用易于扩展的系统平台。
-
公开(公告)号:CN106126648A
公开(公告)日:2016-11-16
申请号:CN201610472048.1
申请日:2016-06-23
Applicant: 华南理工大学
CPC classification number: G06F17/30864 , G06F17/30887 , G06Q30/0623
Abstract: 本发明公开了一种基于重做日志的分布式商品信息爬虫方法,包括:从数据库中读取配置来生成爬虫任务,定义三种爬虫的重做日志记录格式,执行商品搜索爬虫,在电商网站的搜索结果页中提取商品列表并生成商品信息任务和商品评论任务;把商品信息任务和商品评论任务再分配到各个服务器上,执行商品信息爬虫采集并保存商品的各种属性数据,执行商品评论爬虫采集并保存商品的评论数据;重做日志会记录采集失败的任务和状态;定时从重做日志中取出日志,反序列化为爬虫任务进行重新爬取。本发明的基于重做日志的分布式商品信息爬虫方法,能够针对电商网站的商品数据和评论数据的爬取,有效地提高数据采集的效率和完善性。
-
公开(公告)号:CN105912729A
公开(公告)日:2016-08-31
申请号:CN201610333731.7
申请日:2016-05-19
Applicant: 华南理工大学
IPC: G06F17/30
CPC classification number: G06F17/30867
Abstract: 本发明公开了一种基于三维时序动态模型的手机游戏推荐系统,包括用户行为数据获取模块、游戏信息获取模块、用户行为分析模块、游戏标签模块、时序动态模型模块、游戏推荐模块。本发明系统根据获取的用户行为数据进行用户动态行为分析,并追踪新老用户的兴趣变化,在用户兴趣发生变化或可能流失时,综合考虑与用户兴趣游戏相似度较高的游戏以及游戏的热门度,给用户最优的推荐结果。本发明结合游戏和用户的时效性,制定了基于时间窗的用户活跃度评分计算方法。并引用游戏标签来对用户进行相应的映射,从而丰富了游戏推荐的多样性,让用户感受不断有新元素变化的游戏推荐,增强了游戏推荐的新颖性。
-
-
-
-
-
-
-
-
-