一种基于欧氏距离改进的kNN近邻查找方法

    公开(公告)号:CN106250506A

    公开(公告)日:2016-12-21

    申请号:CN201610626850.1

    申请日:2016-08-02

    Applicant: 东南大学

    CPC classification number: G06F9/3885 G06F16/903

    Abstract: 本发明公开了一种基于欧氏距离改进的kNN近邻查找方法。本发明利用欧式空间的特性,通过加减运算替换传统kNN方法中较为复杂的乘方运算,减少计算开销,在不降低查询准确率的条件下,实现对待分类样本的k近邻查找。本发明可有效减少部分样本点的计算量,降低kNN方法的时间复杂度;同时借助简化过程引入的临时变量,规避对全局集中式索引结构的依赖,将传统kNN方法由串行单线程处理模式,非常方便地扩展为多线程处理模式,提升处理器利用率并适应大数据处理的需求。

    一种基于Apriori的分布式快速频繁项集挖掘方法

    公开(公告)号:CN106202575A

    公开(公告)日:2016-12-07

    申请号:CN201610705283.9

    申请日:2016-08-22

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于Apriori的分布式快速频繁项集挖掘方法,通过在记录项集同时记录其所在的对应事物集合,从而在频繁项集挖掘的剪枝部分,利用简单的事物个数统计,实现项集频率的统计,以此达到剪枝的目的。本发明的优势在于克服了传统方法对于输入数据集的频繁扫描,使该方法具有很好的可扩展性,同时该方法结合Spark进行实现,可以很好地处理大数据时代的频繁项集挖掘任务。

Patent Agency Ranking