一种基于学生练习序列的知识概念表示学习方法

    公开(公告)号:CN112988844B

    公开(公告)日:2022-09-27

    申请号:CN202110347398.6

    申请日:2021-03-31

    Applicant: 东北大学

    Abstract: 本发明提供一种基于学生练习序列的知识概念表示学习方法,涉及教育数据挖掘技术领域。该方法中设计了一个可解释的知识追踪模型来追踪学生知识概念掌握随时间的动态变化,提出了一个具有三种交互策略的对数线性模型,其通过分析学生知识概念掌握的动态变化,获得知识概念的分布式表征;此外,在模型设计中融入了猜测和失误因素;使用一个长短期记忆网络来近似后验分布;最后,使用醒眠算法来学习模型参数以及知识概念与题目的分布式表示。本发明通过分析学生的习题反应和知识概念掌握情况来了解知识概念之间的关系,通过大量的学生锻炼序列数据来构建知识概念图,用更优的性能来获取知识的分布式表示。

    一种基于CPU-GPU异构体系结构的并行相似性连接方法

    公开(公告)号:CN111046092B

    公开(公告)日:2022-06-17

    申请号:CN201911057101.1

    申请日:2019-11-01

    Applicant: 东北大学

    Abstract: 本发明公开一种基于CPU‑GPU异构体系结构的并行相似性连接方法,属于计算机数据库技术与并行计算技术领域。该方法通过对数据相似性连接方法进行分析设计,构建新的倒排索引结构,实现在GPU上并行构建倒排索引,对相似性连接方法进行分解,根据两种处理器不同的计算特性重新设计计算过程,基于GPU实现双重前缀过滤,有效减小候选集体积。本发明提供的基于CPU‑GPU异构体系结构的相似性连接方法能够将传统的数据相似性连接准确地转换到CPU‑GPU异构计算体系上,从而有效提高大规模数据集相似性连接的处理效率。

    基于概率图模型的网络表格列类型检测方法

    公开(公告)号:CN114417885A

    公开(公告)日:2022-04-29

    申请号:CN202210070769.5

    申请日:2022-01-21

    Applicant: 东北大学

    Abstract: 本发明提供一种基于概率图模型的网络表格列类型检测方法,属于语义网中的表格解释领域。该方法包括:将来自同一网站下属于相同模式的表格拼接成一张表格;针对拼接表格进行单列分类:首先将所述拼接表格中的列划分为数值型列和字符型列,然后分别针对数值型列和字符型列进行分类;在单列分类结果的基础上通过构建概率图模型挖掘列间隐含的语义关系,实现对整张表的列类型序列的检测。可以对网络表格中列的语义类型进行检测并取得较好的效果,相对于其它列类型检测方法,准确率均有10%及以上提高。

    一种适用于高并发事务的联盟链系统及其设计方法

    公开(公告)号:CN113419823A

    公开(公告)日:2021-09-21

    申请号:CN202110692495.9

    申请日:2021-06-22

    Applicant: 东北大学

    Abstract: 本发明提供一种适用于高并发事务的联盟链系统及其设计方法,涉及区块链技术领域。本系统包含多个组织,每一个组织都包含客户端代理、至少一个Peer节点;本发明设计了一个无协调节点的、支持高并发事务的联盟链系统。本发明提出的联盟链系统减小了共识带来的通信开销,并且在保证一致性的同时,增强事务的并发性,系统的性能得到了明显提升。同时,利用重排序算法优化了并发控制策略,增加了事务的提交成功率,很大程度上减少了无效事务的存储,节约了存储成本。此外,该系统是基于关系型数据库实现,支持SQL语句查询并且单独提供查询接口以实现复杂的查询功能和历史数据查询。

    一种基于编码树的GPU轴心子图匹配方法

    公开(公告)号:CN113204552A

    公开(公告)日:2021-08-03

    申请号:CN202110484541.6

    申请日:2021-04-30

    Applicant: 东北大学

    Abstract: 本发明提供一种基于编码树的GPU轴心子图匹配方法,对每个节点进行压缩编码,首先将节点的标签、度和邻居结构融入到多棵不同的编码树中,然后计算每个编码树的特征向量并保存,在查询图中仅需要比较查询图节点与数据图节点的特征向量编码,即可将数据图中的无效节点进行大规模的过滤,大大缩小了候选节点生成的搜索空间树的尺寸,加快了执行效率;本发明不仅在时间上对轴心子图匹配搜索进行了查询优化,而且对于计算资源和内存资源的消耗也大大减少。

    基于GPU分组LSM树索引的方法

    公开(公告)号:CN112000846B

    公开(公告)日:2021-07-20

    申请号:CN202010836000.0

    申请日:2020-08-19

    Applicant: 东北大学

    Abstract: 本发明提供一种基于GPU分组LSM树索引的方法,涉及GPU数据库技术领域。本发明首先将数据进行预处理,当value为变长时,在GPU上进行查询时不能很好的利用缓存而且数据传输代价也会增大。本发明针对以上情况,将数据中的Key和Value进行分离,GPU中仅仅存放Value的地址,真正的Value存放在内存中。针对LSM插入速度慢的问题,本发明将原来的LSM树每一层分为多个组,每个组都是一个有序数组,合并到下一层的时候通过GPU上大量的线程并行的归并。由于将LSM树进行分组,意味着查询需要花费更高的代价。为了提高查询速度,本发明在GPU上设计了一种适应于GPU结构的布隆过滤器,通过布隆过滤器减少了大量不必要的查询开销。

    一种基于学生练习序列的知识概念表示学习方法

    公开(公告)号:CN112988844A

    公开(公告)日:2021-06-18

    申请号:CN202110347398.6

    申请日:2021-03-31

    Applicant: 东北大学

    Abstract: 本发明提供一种基于学生练习序列的知识概念表示学习方法,涉及教育数据挖掘技术领域。该方法中设计了一个可解释的知识追踪模型来追踪学生知识概念掌握随时间的动态变化,提出了一个具有三种交互策略的对数线性模型,其通过分析学生知识概念掌握的动态变化,获得知识概念的分布式表征;此外,在模型设计中融入了猜测和失误因素;使用一个长短期记忆网络来近似后验分布;最后,使用醒眠算法来学习模型参数以及知识概念与题目的分布式表示。本发明通过分析学生的习题反应和知识概念掌握情况来了解知识概念之间的关系,通过大量的学生锻炼序列数据来构建知识概念图,用更优的性能来获取知识的分布式表示。

    基于GPU并行的自适应基数树动态索引方法

    公开(公告)号:CN112000847A

    公开(公告)日:2020-11-27

    申请号:CN202010836011.9

    申请日:2020-08-19

    Applicant: 东北大学

    Abstract: 本发明提供一种基于GPU并行的自适应基数树动态索引方法。首先构建自适应基数树数据结构,前两层创建Node256类型的树节点,第三、四层的创建基于高位优先的基数排序方法,根据分支的数量创建能容下对应大小的树节点,实现动态数据结构的创建,可以保证在原批数据中最新的更新在进行排序后仍旧是在旧的更新后面,然后去重操作,去掉多余的旧更新保留最新的更新,去重之后再把每一段无重复数据的序列插入该段对应的节点内,完成对整个自适应基数树的创建,其次基于GPU并行计算能力,可以并行进行对数据的插入、查询、删除操作。

    一种安全多方数值型记录匹配方法

    公开(公告)号:CN108334577B

    公开(公告)日:2020-02-07

    申请号:CN201810067980.5

    申请日:2018-01-24

    Applicant: 东北大学

    Abstract: 本发明公开一种安全有效的多方数值型记录匹配方法,属于数据质量和数据集成领域,具体方法为:各数据源间统一参数、生成密钥,接着,进行以下三个步骤,(1)利用类模运算加密各数据源中的数值型记录,(2)安全地查询出各数值型属性中的最大最小值,并优化地计算两者间的相似度作为各记录在该属性中的相似度,(3)通过各记录在各属性中的相似度,判断是否匹配成功。采用本发明的多方数值型记录匹配方法,可以在更短的时间内,更加安全有效地识别出重复的数据对象;通过证明若属性中最大最小值的相似度大于阈值,则任意两个属性值的相似度均大于阈值,只需安全快速地查找出各属性的最大最小值,即可判断各数值型记录是否匹配成功,保证了高效性。

Patent Agency Ranking