一种基于大数据的金融领域人机对话意图识别方法

    公开(公告)号:CN109165284B

    公开(公告)日:2020-06-16

    申请号:CN201810961117.4

    申请日:2018-08-22

    Abstract: 本发明公开了一种基于大数据的金融领域人机对话意图识别方法,包括:101对金融领域人机对话所产生的文本数据的预处理;102对于给定文本数据集进行划分;103根据人机对话的数据进行文本数据特征的构建,包括特征提取,文本向量化;104针对构建完成后的特征,进行降维,稀疏处理;105针对文本数据,建立机器学习模型,来对未知的人机对话进行意图识别。本发明提出利用机器学习来对文本数据进行预测,对已知标签的文本数据训练而得到模型,来预测未知标签的文本数据(该问题属于多分类问题),从而获取该对话所表达的意图(多分类概率最大的概率)。

    Spark平台下基于GPS数据的出租车调配方法

    公开(公告)号:CN106875670B

    公开(公告)日:2019-12-31

    申请号:CN201710131675.3

    申请日:2017-03-07

    Abstract: 本发明请求保护一种Spark平台下基于GPS数据的出租车调配方法,包括:101从调度中心获取出租车历史GPS数据部署到Spark平台上,对数据做并行地预处理操作;102在Spark平台下对出租车历史GPS数据进行分析,提取特征建立回归模型;103在Spark平台下对出租车的实时GPS数据进行提取并预测其未来的路径、终点位置以及到达时间;104根据预测结果对出租车的调配进行优化。本发明主要是在Spark平台下解决出租车调配问题,通过对出租车历史GPS数据的分析,提取特征建立回归模型,从而预测出租车未来的GPS路径、终点位置以及到达时间,继而对出租车的调配进行优化。

    一种基于大数据的物流供应链需求预测方法

    公开(公告)号:CN109740624A

    公开(公告)日:2019-05-10

    申请号:CN201811399639.6

    申请日:2018-11-22

    Abstract: 本发明请求保护一种基于大数据的物流供应链需求预测方法,包括:101对数据进行预处理操作;102对经过预处理的数据进行特征工程构建;103提取目标之间的关系特征;104提取输入输出空间的目标敏感特征;105建立机器学习模型,根据供应链的历史需求数据进行预测。本发明主要是通过提取关于物流供应链需求预测目标的输入输出空间的敏感特征来处理输入空间和输出空间的复杂关系,建立机器学习模型,从而预测供应链在未来5周内的需求,使得商家能够在正确的时间给用户最有效服务。

    一种基于视频监控的车辆跟踪与分割方法

    公开(公告)号:CN105930833B

    公开(公告)日:2019-01-22

    申请号:CN201610338147.0

    申请日:2016-05-19

    Abstract: 本发明请求保护一种基于视频监控的车辆跟踪与分割方法,包括:预先浏览视频前20帧确定车辆行驶方法和车道宽度;初始化第1帧图像建立背景模型;从第2帧开始,利用背景模型提取所述视频帧图像的前景图像;更新背景模型;结合前景图像的面积及其外接矩形的面积联合判定前景图像是否为运动车辆;根据前景图像的外接凸包对运动目标进行粘连车辆判定;若为粘连车辆,对车辆进行分割;将车辆加入跟踪队列进行跟踪。本发明能够实时对视频中的车辆进行稳定的跟踪,并能够对粘连车辆进行分割,处理速度快,可满足对实时系统的要求。

    一种基于多特征和稀疏表示的图像检索系统及方法

    公开(公告)号:CN104142978B

    公开(公告)日:2018-04-27

    申请号:CN201410333879.1

    申请日:2014-07-14

    Abstract: 本发明公开了一种基于多特征和稀疏表示的图像检索系统及方法,系统包括特征提取模块、特征字典构造模块、相似性度量模块、信息存储模块、查询交互模块。所述特征提取模块,采用结合形状和颜色的图像特征,色彩增强高斯拉普拉斯特征(CLOG特征)和SURF特征;所述特征字典构造模块,通过在线字典学习算法,将原始特征压缩为过完备字典特征,弥补了原始特征过于稠密的缺点;所述相似性度量模块,引入稀疏表示理论,比较查询图像由原字典和相关字典表示产生的残差大小,判断两幅图像的相似度,避免了传统相似性度量方法特征依赖性较高的问题。本发明可以有效检索旋转、噪声、光照变化图像,显著提高了图像检索的鲁棒性。

    一种基于主动学习的数据自动标注方法

    公开(公告)号:CN107067025A

    公开(公告)日:2017-08-18

    申请号:CN201710081921.9

    申请日:2017-02-15

    Abstract: 本发明请求保护一种基于主动学习的数据自动标注方法,属于主动学习领域,包括以下步骤:101对已标记和未标记数据进行处理;102利用多个不同分类器对未标记数据进行分类;103选出分歧熵低的数据;104对分歧熵低的数据进行人工标记;105对人工标记结果进行自检。本发明针对如何在减少人工标注数据的数量的同时,尽量保证人工标注数据的准确性问题,通过结合主动学习方法发明一个附带自检功能的数据自动标注系统,达到缩减工作量且提高人工标注数据准确性的目的。

    一种基于Spark下并行超网络的分类算法

    公开(公告)号:CN106777006A

    公开(公告)日:2017-05-31

    申请号:CN201611115832.3

    申请日:2016-12-07

    Abstract: 本发明涉及一种基于Spark下并行超网络的分类算法,具体包括以下步骤:步骤S1.把文本数据部署到Spark平台上;步骤S2.在Spark平台上对文本数据进行并行化预处理;步骤S3.在Spark平台上,对超网络算法的演化学习进行并行化实现。本发明主要解决在大规模文本数据量的情况下,演化超网络分类算法的并行处理问题,通过分布式数据存储阶段,数据预处理阶段,并且通过改变超边结构以及超网络演化计算方式,修改目标函数,完成对超网络算法的并行化处理,提高传统超网络的分类算法性能和效率,解决在海量数据中,传统的超网络模型已经难以满足时间和空间的限制。

    一种基于Spark的高维稀疏文本数据聚类方法

    公开(公告)号:CN106570173A

    公开(公告)日:2017-04-19

    申请号:CN201610988558.4

    申请日:2016-11-09

    Abstract: 本发明请求保护一种基于Spark的高维稀疏文本数据聚类方法,包括步骤:用RDD读入数据集;并用RDD接口设计出分布式稀疏向量集;分布式稀疏向量集与其所在结点的完整数据集计算相似度,按编号抽象为相似矩阵。将存放的相似矩阵对称化,并求其归一化形式和Laplace矩阵形式。4、利用SVD分解步骤3中归一化Laplace矩阵,5、步骤4构建的新矩阵作为样本输入到K‑means模型进行训练。6、利用建立的模型对测试集进行聚类。本发明提高了传统谱聚类算法在大数据集下的运算性能。

    一种基于神经网络的仿生趋温行为方法

    公开(公告)号:CN105824251A

    公开(公告)日:2016-08-03

    申请号:CN201610332849.8

    申请日:2016-05-18

    CPC classification number: G05B17/02

    Abstract: 本发明涉及人工神经网络控制与机器人导航领域,公开了一种基于神经网络的仿生趋温行为方法,包括:1)环境建模,将温度分布情况通过高斯函数进行建模;2)线虫肌肉结构建模,将线虫全身建模成多关节连杆结构;3)运动学建模,构建了线虫一次偏转运动过程;4)偏向角度建模,根据线虫头部结点前后两个时刻的温度差和该时刻与最适温度的差值,通过一个非线性函数求出下一时刻的偏转角度;5)人工神经网络建模,构建三层人工神经网络结构,对偏转运动过程中的非线性函数进行拟合。本方法对研究生物体趋温性行为的本质具有重要的理论意义。同时,对爬虫机器人的神经网络构建、步态控制、运动策略选择和偏转运动控制等方面的研究具有重要的指导意义。

Patent Agency Ranking