一种基于最近邻KNN算法的缺失数据填补方法

    公开(公告)号:CN107193876B

    公开(公告)日:2020-10-09

    申请号:CN201710267672.2

    申请日:2017-04-21

    Abstract: 本发明公开了一种基于最近邻KNN算法的缺失数据填补方法,包括:自动识别数据集中的存在缺失值的特征属性;遍历存在缺失值的特征属性利用近邻KNN算法逐步填充缺失值;在对每一个特征属性进行缺失值填充过程中,迭代KNN算法参数k,获得不同参数配置的KNN模型簇;根据优化目标函数遴选最优模型,并利用该模型对缺失数据进行缺失值填充。由于算法参数k对KNN算法影响较大,在此,我们采用寻优的策略运用到缺失值填充模型的建模中,可以很大程度提高模型的精度,填充数据的质量相应有了很大程度的提高。

    基于随机森林的风电机组故障智能诊断预警的方法

    公开(公告)号:CN107179503B

    公开(公告)日:2020-07-07

    申请号:CN201710266789.9

    申请日:2017-04-21

    Abstract: 本发明公开了一种基于随机森林的风电机组故障智能诊断预警的方法,包括:抽取风电机组状态的历史数据作为样本数据;对所述样本数据进行探索性分析及预处理;构建基于随机森林的风电机组故障智能诊断预警模型,根据模型结果进行分析并评价模型;利用分析评价后的模型对风电机组设备进行实时诊断,若诊断结果为不正常,该模型将发出告警信息。本发明采用随机森林算法,考虑指标整体的特征,这种方法不仅可以解决单个指标决定设备状态的问题,而且可以综合考虑众多指标之间隐藏知识相关性,对输出结果做出综合性的判断。

    基于随机森林的风电机组故障智能诊断预警的方法

    公开(公告)号:CN107179503A

    公开(公告)日:2017-09-19

    申请号:CN201710266789.9

    申请日:2017-04-21

    CPC classification number: G01R31/343 G06K9/6282

    Abstract: 本发明公开了一种基于随机森林的风电机组故障智能诊断预警的方法,包括:抽取风电机组状态的历史数据作为样本数据;对所述样本数据进行探索性分析及预处理;构建基于随机森林的风电机组故障智能诊断预警模型,根据模型结果进行分析并评价模型;利用分析评价后的模型对风电机组设备进行实时诊断,若诊断结果为不正常,该模型将发出告警信息。本发明采用随机森林算法,考虑指标整体的特征,这种方法不仅可以解决单个指标决定设备状态的问题,而且可以综合考虑众多指标之间隐藏知识相关性,对输出结果做出综合性的判断。

    一种金融信贷短信的信息抽取和分析方法

    公开(公告)号:CN107423279B

    公开(公告)日:2021-01-15

    申请号:CN201710233822.8

    申请日:2017-04-11

    Abstract: 本发明公开了一种金融信贷短信的信息抽取和分析方法,包括:训练构建信贷类短信分类模型;使用信贷类短信分类模型对信贷类短信进行识别,并筛选出信贷类短信;构造关键词,并将筛选出的信贷类短信进行关键词匹配后分析具体业务类型;构造信息抽取规则模板引擎;使用信息抽取规则模板引擎对具体业务类型进行信息点的抽取与结构化输出。与现有技术相比,本发明提出了一种适用于金融领域的信贷短息的信息抽取方法,通过机器学习的分类算法和自然语言处理的信息抽取技术,结合规则引擎技术,具备高度的灵活性和可扩展性,实现短信逾期等高风险信息的自动抽取和高效识别。

    一种金融信贷短信的信息抽取和分析方法

    公开(公告)号:CN107423279A

    公开(公告)日:2017-12-01

    申请号:CN201710233822.8

    申请日:2017-04-11

    Abstract: 本发明公开了一种金融信贷短信的信息抽取和分析方法,包括:训练构建信贷类短信分类模型;使用信贷类短信分类模型对信贷类短信进行识别,并筛选出信贷类短信;构造关键词,并将筛选出的信贷类短信进行关键词匹配后分析具体业务类型;构造信息抽取规则模板引擎;使用信息抽取规则模板引擎对具体业务类型进行信息点的抽取与结构化输出。与现有技术相比,本发明提出了一种适用于金融领域的信贷短息的信息抽取方法,通过机器学习的分类算法和自然语言处理的信息抽取技术,结合规则引擎技术,具备高度的灵活性和可扩展性,实现短信逾期等高风险信息的自动抽取和高效识别。

    一种基于最近邻KNN算法的缺失数据填补方法

    公开(公告)号:CN107193876A

    公开(公告)日:2017-09-22

    申请号:CN201710267672.2

    申请日:2017-04-21

    Abstract: 本发明公开了一种基于最近邻KNN算法的缺失数据填补方法,包括:自动识别数据集中的存在缺失值的特征属性;遍历存在缺失值的特征属性利用近邻KNN算法逐步填充缺失值;在对每一个特征属性进行缺失值填充过程中,迭代KNN算法参数k,获得不同参数配置的KNN模型簇;根据优化目标函数遴选最优模型,并利用该模型对缺失数据进行缺失值填充。由于算法参数k对KNN算法影响较大,在此,我们采用寻优的策略运用到缺失值填充模型的建模中,可以很大程度提高模型的精度,填充数据的质量相应有了很大程度的提高。

Patent Agency Ranking