-
公开(公告)号:CN107193876B
公开(公告)日:2020-10-09
申请号:CN201710267672.2
申请日:2017-04-21
Applicant: 美林数据技术股份有限公司
IPC: G06F16/215 , G06F16/23
Abstract: 本发明公开了一种基于最近邻KNN算法的缺失数据填补方法,包括:自动识别数据集中的存在缺失值的特征属性;遍历存在缺失值的特征属性利用近邻KNN算法逐步填充缺失值;在对每一个特征属性进行缺失值填充过程中,迭代KNN算法参数k,获得不同参数配置的KNN模型簇;根据优化目标函数遴选最优模型,并利用该模型对缺失数据进行缺失值填充。由于算法参数k对KNN算法影响较大,在此,我们采用寻优的策略运用到缺失值填充模型的建模中,可以很大程度提高模型的精度,填充数据的质量相应有了很大程度的提高。
-
公开(公告)号:CN107179503B
公开(公告)日:2020-07-07
申请号:CN201710266789.9
申请日:2017-04-21
Applicant: 美林数据技术股份有限公司
Abstract: 本发明公开了一种基于随机森林的风电机组故障智能诊断预警的方法,包括:抽取风电机组状态的历史数据作为样本数据;对所述样本数据进行探索性分析及预处理;构建基于随机森林的风电机组故障智能诊断预警模型,根据模型结果进行分析并评价模型;利用分析评价后的模型对风电机组设备进行实时诊断,若诊断结果为不正常,该模型将发出告警信息。本发明采用随机森林算法,考虑指标整体的特征,这种方法不仅可以解决单个指标决定设备状态的问题,而且可以综合考虑众多指标之间隐藏知识相关性,对输出结果做出综合性的判断。
-
公开(公告)号:CN107179503A
公开(公告)日:2017-09-19
申请号:CN201710266789.9
申请日:2017-04-21
Applicant: 美林数据技术股份有限公司
CPC classification number: G01R31/343 , G06K9/6282
Abstract: 本发明公开了一种基于随机森林的风电机组故障智能诊断预警的方法,包括:抽取风电机组状态的历史数据作为样本数据;对所述样本数据进行探索性分析及预处理;构建基于随机森林的风电机组故障智能诊断预警模型,根据模型结果进行分析并评价模型;利用分析评价后的模型对风电机组设备进行实时诊断,若诊断结果为不正常,该模型将发出告警信息。本发明采用随机森林算法,考虑指标整体的特征,这种方法不仅可以解决单个指标决定设备状态的问题,而且可以综合考虑众多指标之间隐藏知识相关性,对输出结果做出综合性的判断。
-
公开(公告)号:CN107423279B
公开(公告)日:2021-01-15
申请号:CN201710233822.8
申请日:2017-04-11
Applicant: 美林数据技术股份有限公司
IPC: G06F40/289 , G06F40/216 , G06F40/242 , G06F40/253 , G06F16/35 , G06F16/36 , G06F16/903 , G06Q40/02
Abstract: 本发明公开了一种金融信贷短信的信息抽取和分析方法,包括:训练构建信贷类短信分类模型;使用信贷类短信分类模型对信贷类短信进行识别,并筛选出信贷类短信;构造关键词,并将筛选出的信贷类短信进行关键词匹配后分析具体业务类型;构造信息抽取规则模板引擎;使用信息抽取规则模板引擎对具体业务类型进行信息点的抽取与结构化输出。与现有技术相比,本发明提出了一种适用于金融领域的信贷短息的信息抽取方法,通过机器学习的分类算法和自然语言处理的信息抽取技术,结合规则引擎技术,具备高度的灵活性和可扩展性,实现短信逾期等高风险信息的自动抽取和高效识别。
-
公开(公告)号:CN107423279A
公开(公告)日:2017-12-01
申请号:CN201710233822.8
申请日:2017-04-11
Applicant: 美林数据技术股份有限公司
Abstract: 本发明公开了一种金融信贷短信的信息抽取和分析方法,包括:训练构建信贷类短信分类模型;使用信贷类短信分类模型对信贷类短信进行识别,并筛选出信贷类短信;构造关键词,并将筛选出的信贷类短信进行关键词匹配后分析具体业务类型;构造信息抽取规则模板引擎;使用信息抽取规则模板引擎对具体业务类型进行信息点的抽取与结构化输出。与现有技术相比,本发明提出了一种适用于金融领域的信贷短息的信息抽取方法,通过机器学习的分类算法和自然语言处理的信息抽取技术,结合规则引擎技术,具备高度的灵活性和可扩展性,实现短信逾期等高风险信息的自动抽取和高效识别。
-
公开(公告)号:CN107193876A
公开(公告)日:2017-09-22
申请号:CN201710267672.2
申请日:2017-04-21
Applicant: 美林数据技术股份有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种基于最近邻KNN算法的缺失数据填补方法,包括:自动识别数据集中的存在缺失值的特征属性;遍历存在缺失值的特征属性利用近邻KNN算法逐步填充缺失值;在对每一个特征属性进行缺失值填充过程中,迭代KNN算法参数k,获得不同参数配置的KNN模型簇;根据优化目标函数遴选最优模型,并利用该模型对缺失数据进行缺失值填充。由于算法参数k对KNN算法影响较大,在此,我们采用寻优的策略运用到缺失值填充模型的建模中,可以很大程度提高模型的精度,填充数据的质量相应有了很大程度的提高。
-
公开(公告)号:CN107103441A
公开(公告)日:2017-08-29
申请号:CN201710267283.X
申请日:2017-04-21
Applicant: 美林数据技术股份有限公司
CPC classification number: G06Q10/087 , G06K9/6218 , G06K9/6247 , G06K9/6267 , G06Q10/0875
Abstract: 本发明公开了基于自组织特征映射网络的电力物资分类方法,包括以下步骤:物资数据采集:选取物资数据并将选取的物资数据构建成电力物资指标体系;物资数据分析:将电力物资指标体系中的数据按照非线性主成分分析法选择出电力物资主成分分析指标;物资分类:采用自组织特征映射网络(SOFM)算法对选择出的电力物资主成分分析指标进行指标细分,并根据细分指标做聚类,建立电力物资的分类。
-
-
-
-
-
-