一种基于密度峰的动态图聚类方法

    公开(公告)号:CN109886313A

    公开(公告)日:2019-06-14

    申请号:CN201910080266.4

    申请日:2019-01-28

    Applicant: 东北大学

    Inventor: 谷峪 吴长发 于戈

    Abstract: 本发明提供了一种基于密度峰的动态图聚类方法,用于对动态图进行聚类,实时返回聚类结果以及发现簇演化事件,其中聚类结果包括图中的簇、异常顶点以及桥顶点。包括静态图聚类方法和动态图聚类方法两部分,分为初始化和动态检测两个阶段。在初始化阶段,计算顶点的局部密度、依赖顶点和依赖相似度;为提升算法效率,生成DP-Index索引;生成决策图,通过决策图得到密度峰顶点和噪声顶点;基于密度峰思想获得簇结果集、异常顶点集以及桥顶点集;根据聚类结果创建依赖图,为动态图聚类打下基础。在动态更新阶段,根据顶点的插入或删除和边的插入或删除更新DP-Index索引以及依赖图;根据依赖图以及依赖图的动态变化获得聚类结果以及簇演化事件。

    基于可扩展标记语言查询的网页数据抽取方法

    公开(公告)号:CN101984434B

    公开(公告)日:2012-09-05

    申请号:CN201010545520.2

    申请日:2010-11-16

    Applicant: 东北大学

    Abstract: 一种基于可扩展语言查询的网页数据抽取方法,属于计算机数据库技术领域,包括以下:步骤确定Web页面中抽取数据内容时所对应的模式结构;定位Web页面中数据区域、数据单元和属性文本;对属性文本进行语义标注;生成数据单元节点路径:计算抽取属性值的路径表达式;生成数据抽取的XML查询语句;利用XML查询语句抽取数据,本发明能够生成精确的XML查询语句,保证XML查询语句的正确性,本发明具有较高的通用性,能够与已有无缝融合,本发明能够适应更加复杂的查询结果输出。

    可重配置FPGA上可抢占硬件多任务系统及其实现方法

    公开(公告)号:CN101727423A

    公开(公告)日:2010-06-09

    申请号:CN200810228134.3

    申请日:2008-10-17

    Applicant: 东北大学

    Abstract: 本发明涉及一种可重配置FPGA上可抢占硬件多任务系统及其实现方法,系统包括可重配置逻辑模块,通过通信接口与总线宏相连接;硬件任务访问控制器,通过总线宏与可重配置逻辑模块相连;ICAP控制器,通过ICAP接口与可重配置逻辑模块相连;外部存储器控制器,与FPGA外部存储器相联;微处理器,通过总线宏与硬件任务访问控制器相连;方法为:要求任务i运行;判断是否有容纳任务i运行的空间;如没有则选择正在执行的任务j;停止任务j时钟,读取硬件任务j;将硬件任务i的比特流从外部存储器控制器读取至ICAP控制器;判断任务i是否是曾经被执行并被抢占的任务;如果是,则将任务j的状态信息写入状态寄存器。本发明降低了硬件任务抢占时的时间开销,硬件任务恢复时比特流下载的时间短。

    一种基于学习者认知风格的可解释知识追踪方法

    公开(公告)号:CN117494810A

    公开(公告)日:2024-02-02

    申请号:CN202311446003.3

    申请日:2023-11-02

    Applicant: 东北大学

    Abstract: 本发明提供一种基于学习者认知风格的可解释知识追踪方法,涉及教育数据挖掘技术领域。本发明将信息加工的知识追踪模型IPKT与认知风格概念结合,得到基于认知风格的可解释知识追踪模型CSKT,其中,识别层根据学习者的认知风格提取题目中被学习者关注到的习题信息,从学习者知识状态中提取学习者认为能够用来解决习题的知识,定义层根据识别层的输出信息来表征题目,探索层预测学习者在题目上的表现,回顾层根据习题、真实和预测的答题反馈以及学习者的认知风格来更新学习者知识状态及认知风格。本发明能够个性化的建模学习者的知识掌握水平,并预测学习者未来的答题表现,有效解决知识追踪模型缺乏个性化和可解释性差的问题。

    一种基于知识空间的知识追踪方法

    公开(公告)号:CN117371528A

    公开(公告)日:2024-01-09

    申请号:CN202311485074.4

    申请日:2023-11-09

    Applicant: 东北大学

    Abstract: 本发明设计一种基于知识空间的知识追踪方法;考虑知识概念之间的先决关系,将其表示为知识概念依赖图;构建问题概念图来捕捉问题与知识概念间关系,并融合问题难度特征和概念依赖图,得到增强问题概念图;基于学生与问题交互记录构建学生问题交互图,并将其分为只包含正确交互和错误交互的二部图;将问题难度作为问题属性信息,构建问题难度图;对这四个子图建模,获得有效问题表示;采用注意力机制和LSTM对学生历史学习记录进行建模;根据遗忘曲线理论,引入时间衰减因子来模拟人脑的遗忘效应,进一步优化模型;采用交叉熵损失函数作为目标函数,通过最小化学生真实答案与模型预测正确概率之间的差异来进行知识追踪模型训练和优化。

    一种基于元路径和注意力机制的知识追踪方法

    公开(公告)号:CN116821497A

    公开(公告)日:2023-09-29

    申请号:CN202310780118.X

    申请日:2023-06-29

    Applicant: 东北大学

    Abstract: 本发明涉及知识追踪领域,提出了一种基于元路径和注意力机制的知识追踪方法。采集到的学生学习行为数据经过处理后,根据定义的元路径,采用随机游走方法生成路径实例,构建卷积神经网络得到路径实例语义信息。利用Embedding方法得到学生和习题的嵌入。利用Word2Vec与长短期记忆网络结合的方法得到知识点的嵌入,再根据自注意力机制获得知识点的融合嵌入。结合注意力机制和路径实例语义信息分别获得学生和习题的最终嵌入。将得到的嵌入与数据集涵盖的历史做题序列拼接后输入到长短期记忆网络中获取知识点熟练度。本发明在传统技术的基础上利用学生、习题、知识点间元路径的语义信息嵌入及知识点融合嵌入加强了对知识点熟练度的评估,提高了知识追踪的效果。

    一种面向结构化数据的稠密向量检索方法

    公开(公告)号:CN116662581A

    公开(公告)日:2023-08-29

    申请号:CN202310589259.3

    申请日:2023-05-24

    Applicant: 东北大学

    Abstract: 本发明属于结构数据检索技术领域,公开了一种面向结构化数据的稠密向量检索方法。建立语言模型结构;收集结构化数据和非结构化数据对,识别结构化数据中的实体;结构化数据和非结构化数据对齐;通过对现有的结构化数据和非结构化数据作对比学习,优化语言模型中的向量空间;实体掩码预测;所识别的结构化数据中的实体采用掩码语言建模的方式来学习结构化数据中潜在的结构信息,进一步优化语言模型中的向量空间。本发明所提出的方法,在代码搜索和产品搜索方面取得了最先进的效果。此外我们的模型还具有很强的零样本能力,在一些数据集上甚至超过了其它模型微调后的效果。

    一种利用GPU加速密度峰聚类的方法

    公开(公告)号:CN112052879B

    公开(公告)日:2023-06-13

    申请号:CN202010811897.1

    申请日:2020-08-13

    Applicant: 东北大学

    Abstract: 本发明属于大数据处理领域,涉及一种利用GPU加速密度峰聚类的方法。本发明通过设计新的索引结构来减少距离矩阵的计算量,并利用GPU来加速索引的构建和近邻搜索,提高密度峰聚类算法中每个点的密度值和斥群值计算效率。本发明通过在GPU上构建制高点树索引,并行地计算每个数据点的密度值和斥群值,在用户选择完聚类中心后可以并行分配每个点所属的聚类,有效地减少了距离矩阵的计算量且节省储存空间。相较于传统的聚类方法,使用GPU加速的密度峰聚类方法能够更高效地完成聚类任务。

Patent Agency Ranking