基于Spark平台运行的P-CFSFDP密度聚类方法

    公开(公告)号:CN110008994A

    公开(公告)日:2019-07-12

    申请号:CN201910159193.8

    申请日:2019-03-04

    Abstract: 本发明公开了一种基于Spark平台运行的P-CFSFDP密度聚类方法,基于快速搜索进行聚类并找出密度峰值(CFSFDP)算法思想,实现一个可以在Spark平台上运行的P-CFSFDP密度聚类方法,同时改进现有方法的缺陷,在数据结构和自动选取中心点方面进行功能优化。该方法通过Spark并行处理,通过对输入数据进行密度和距离的定义,将一组(抽象或具体)的对象分组到多个类中,通过某种标准或规则使得同一类中的对象尽可能相似,不同类中的对象尽可能不相似。本发明基于Spark平台,通过计算输入数据的密度值和距离值进行密度聚类,提升聚类的计算效率、计算精度和准确性,有助于快速实现大数据聚类和分析。

    一种融合GAN和迁移学习的电商评价情感分析方法

    公开(公告)号:CN110008338A

    公开(公告)日:2019-07-12

    申请号:CN201910159199.5

    申请日:2019-03-04

    Abstract: 本发明公开了一种融合GAN和迁移学习的电商评价情感分析方法,该方法基于GAN构建迁移学习框架,通过标注的源领域文本数据和少量标注的目标领域文本数据训练生成模型和鉴别模型,生成模型生成数据训练分类器用于特定的分类任务来实现源领域到目标领域的迁移。本发明在进行特定的电子商务评价情感分析任务时,减少了模型训练的数据收集处理工作,用户只需使用标注的源领域文本数据和少量标注的目标领域文本数据训练即可,而不需要进行大量目标领域文本数据的标注工作。本发明提出的方法使迁移架构和任务结构分离,对传统的迁移学习方法进行了突破,可实现跨领域迁移学习和异构迁移学习,提升数据分析的智能化水平。

    一种融合GAN和迁移学习的电商评价情感分析方法

    公开(公告)号:CN110008338B

    公开(公告)日:2021-01-19

    申请号:CN201910159199.5

    申请日:2019-03-04

    Abstract: 本发明公开了一种融合GAN和迁移学习的电商评价情感分析方法,该方法基于GAN构建迁移学习框架,通过标注的源领域文本数据和少量标注的目标领域文本数据训练生成模型和鉴别模型,生成模型生成数据训练分类器用于特定的分类任务来实现源领域到目标领域的迁移。本发明在进行特定的电子商务评价情感分析任务时,减少了模型训练的数据收集处理工作,用户只需使用标注的源领域文本数据和少量标注的目标领域文本数据训练即可,而不需要进行大量目标领域文本数据的标注工作。本发明提出的方法使迁移架构和任务结构分离,对传统的迁移学习方法进行了突破,可实现跨领域迁移学习和异构迁移学习,提升数据分析的智能化水平。

Patent Agency Ranking