-
公开(公告)号:CN112464984A
公开(公告)日:2021-03-09
申请号:CN202011171335.1
申请日:2020-10-28
Applicant: 东南大学
Abstract: 本发明公开一种基于注意力机制和强化学习的自动特征构造方法,依次包括以下步骤:步骤1:给定分类问题的数据集DTR,包含一个数值型特征集合S,设置参数最大迭代次数maxIterations,嵌入尺寸embeddingSize的取值;步骤2:将数据集和参数传入该自动特征构造方法,运行得到分类结果。该方法包含基于自注意力机制的特征生成器和基于强化学习的特征选择器,通过迭代不断探索与利用所生成的特征,在有限步骤内以全局最优的特征生成和选择方案指导测试集的特征生成,从而自动得到最优的分类结果。
-
公开(公告)号:CN109101570A
公开(公告)日:2018-12-28
申请号:CN201810786032.7
申请日:2018-07-17
Applicant: 东南大学
IPC: G06F17/30
Abstract: 本发明公开一种基于图摘要的图模式挖掘方法PDDGS算法,依次包括以下步骤:步骤1:给定输入图G和支持度S,使用RoG算法将输入图G进行摘要,得到摘要图Gs;步骤2:根据步骤1得到的摘要图G是,运用GraphZip算法进行图模式挖掘,产生候选集合;步骤3:对候选集合进行筛选,生成挖掘结果。通过引入图摘要阶段,将原始图进行拆解、划分,大大提高了图模式挖掘的效率。因此本发明具有较高的使用价值。
-
公开(公告)号:CN106055674A
公开(公告)日:2016-10-26
申请号:CN201610393610.1
申请日:2016-06-03
Applicant: 东南大学
IPC: G06F17/30
CPC classification number: G06F16/24532
Abstract: 本发明公开一种分布式环境下基于度量空间的top‑k支配查询方法,依次包括以下步骤:步骤1:给定查询输入集合Q以及度量空间中的距离公式d(),距离公式用来衡量整个数据对象与查询对象Q之间的距离;步骤2:根据步骤1提出基于集合ANN和k‑skyband并行算法。通过在分布式环境下充分利用各个节点之间的并行计算的特点,通过剪枝、排序极大的改善了在大数据集环境下基于度量空间的top‑k支配查询性能,加快查询速度,为用户的决策提供服务。
-
公开(公告)号:CN104809210A
公开(公告)日:2015-07-29
申请号:CN201510209691.0
申请日:2015-04-28
Applicant: 东南大学
IPC: G06F17/30
CPC classification number: G06F17/3053
Abstract: 本发明公开了一种基于spark分布式计算框架下海量数据的top-k查询优化方法,将海量数据集预先进行数据分割,主要采用的是类似网格的数据分割方法。将原始数据集划分为不同的子数据集,然后根据用户对数据对象的每个属性赋予的权重以及查询k值,选取少量合适的子数据集代替整个数据集进行查询。实验结果证明本文提出的方法查询速度较快,而且具有良好的可扩展性。与传统top-k查询方法以及基于角度和距离数据分割方法进行对比,提高了查询速度,能够在短时间内及时反馈给用户需要查询的信息。
-
公开(公告)号:CN104732547A
公开(公告)日:2015-06-24
申请号:CN201510159006.8
申请日:2015-04-03
Applicant: 东南大学
IPC: G06T7/00
Abstract: 本发明公开了一种基于高次幂邻接矩阵hash比对的图同构判定方法,包含如下步骤:利用高次幂邻接矩阵计算各长度的图路径信息;用hash函数统计高次幂邻接矩阵中的顶点路径信息;根据顶点的路径信息对候选顶点匹配集进行划分;从而实现2个图的快速同构判定。本发明能够在比对的过程对候选顶点匹配集进行划分,大大地降低了图同构判定的时间复杂度。利用图从局部到全局的特征信息来进行图同构判定适用范围广,在不同类型、不同大小的图同构判定都获得了较高的判定效率。因此本发明具有较高的使用价值。
-
-
-
-