-
公开(公告)号:CN101984434A
公开(公告)日:2011-03-09
申请号:CN201010545520.2
申请日:2010-11-16
Applicant: 东北大学
IPC: G06F17/30
Abstract: 一种基于可扩展语言查询的网页数据抽取方法,属于计算机数据库技术领域,包括以下:步骤确定Web页面中抽取数据内容时所对应的模式结构;定位Web页面中数据区域、数据单元和属性文本;对属性文本进行语义标注;生成数据单元节点路径:计算抽取属性值的路径表达式;生成数据抽取的XML查询语句;利用XML查询语句抽取数据,本发明能够生成精确的XML查询语句,保证XML查询语句的正确性,本发明具有较高的通用性,能够与已有无缝融合,本发明能够适应更加复杂的查询结果输出。
-
公开(公告)号:CN101582074A
公开(公告)日:2009-11-18
申请号:CN200910010201.9
申请日:2009-01-21
Applicant: 东北大学
IPC: G06F17/30
Abstract: 一种DeepWeb响应页面数据抽取方法,属于深层网络数据管理领域,该方法包括以下步骤:(1)选取DeepWeb响应页面Page;在查询页面输入关键字Key,查询得到响应页面Page;(2)抽取页面模板信息;对于响应页面的DOM树结构,找到包含关键字的孩子结点个数Wn最多的双亲结点P,将带标记的token块序列转化为带标记的token字符序列;用LCS算法处理以上两个记录的带标记的token字符序列,分隔并过滤公共token字符序列得到模板信息;(3)数据抽取;(4)token块合并;(5)数据表格聚类;本发明的有益效果:采用本发明的数据抽取方法,适用性强,精度高,效率得到大大提高。
-
公开(公告)号:CN101561813A
公开(公告)日:2009-10-21
申请号:CN200910011738.7
申请日:2009-05-27
Applicant: 东北大学
Abstract: 一种Web环境下的字符串相似度分析方法,首先定义基本操作代价;对字符串预处理,识别它的词首字符和去除非实意字符;创建距离矩阵,通过创建匹配索引实现编辑距离的优化;然后,判断缩写词,先判断两个字符串是否是缩写关系,如果是缩写关系则进行距离优化;其中,缩写关系由2个因素决定:①判断两者是否有相似度;②判断两者的词首字符是否被匹配;之后对缩写词距离优化,通过减少连续插入字符和连续删除字符的代价实现。本发明的字符串相似度分析方法能很好地处理web中经常出现的省略、缩写和字符顺序颠倒情况,具有较高适用性,在Web未知环境下,具有较高的匹配精度。
-
公开(公告)号:CN118656545A
公开(公告)日:2024-09-17
申请号:CN202411110330.6
申请日:2024-08-14
Applicant: 东北大学
IPC: G06F16/9535 , G06N3/042 , G06N3/0464 , G06N3/08 , G06Q50/20
Abstract: 本发明公开了一种图卷积网络驱动的多任务学习资源推荐方法,涉及智慧教育的技术领域,本发明旨在解决多任务推荐问题,提升学生个性化学习体验并优化学习资源的合理分配,本发明至少包括:分别构建学生与课程、知识概念和视频之间交互关系的图结构;使用图嵌入模块利用改进的图卷积网络对图结构进行处理,学习并生成图嵌入表示;将所述图嵌入表示作为多任务推荐模块的输入,使用多个专家网络进行特征提取,使用门控机制动态整合专家知识,聚合专家表示,得到各个子任务的特定表示;最后同时生成课程推荐、知识概念推荐和视频推荐的结果;实现了基于图卷积网络的多任务推荐,为学生提供更加全面、个性化的学习体验。
-
公开(公告)号:CN118152667B
公开(公告)日:2024-07-02
申请号:CN202410571166.2
申请日:2024-05-10
Applicant: 东北大学
IPC: G06F16/9535 , G06F18/214 , G06F18/22
Abstract: 本发明公开了一种面向学生偏好的习题推荐方法,涉及智慧教育的技术领域,本发明旨在解决通过优化习题推荐策略来提高学生学习体验的问题,本发明至少包括如下步骤:形成训练数据集,获取学生与习题的交互行为数据;根据交互行为数据,进行相似程度计算,计算习题之间或学生之间的相似程度;根据相似程度计算结果,选择与目标习题或学生最相似的一组邻域;使用学生对每道题目的尝试次数和相似程度生成学生对题目兴趣程度的预测结果;利用学生与习题的历史交互日志进行建模,根据学生对题目兴趣程度的预测结果为每个学生推荐题目,生成推荐集合;实现了基于学生相似性或习题相似性进行学生偏好习题推荐,为学生提供更加全面、个性化的学习体验。
-
公开(公告)号:CN117556343A
公开(公告)日:2024-02-13
申请号:CN202311585786.3
申请日:2023-11-24
Applicant: 东北大学
IPC: G06F18/2415 , G06Q50/20
Abstract: 本发明提供一种基于Bloom认知理论的知识熟练度计算方法,涉及教育数据挖掘技术领域。该方法首先将学生做题日志和标记的题目‑‑知识点矩阵,分别定义为矩阵R和矩阵Q,进行层级理论假设和层间理论假设,构建知识熟练度计算模型;然后分别利用基于矩阵分解和神经网络BloomCDM的方法,实现BloomCDM模型参数的学习,进而确定学生的知识熟练度矩阵;最后设计高阶知识组结构发现模型HKG‑D,采用特征降维算法和聚类算法,获取高阶知识组结构,从知识组中抽象出高阶知识点,进而完善高阶知识组结构的构建。该方法在建模过程中,提出了知识组和高阶知识组的概念,完善了教育理论在计算科学中的表示。
-
公开(公告)号:CN112989706B
公开(公告)日:2023-09-29
申请号:CN202110354200.7
申请日:2021-04-01
Applicant: 东北大学
IPC: G06F30/27 , G06F119/04
Abstract: 本发明公开了一种隧道灯具照度衰减预测方法,选择使用递归特征消除(Recursive feature elimination)算法;基于全部特征进行训练;特征被消除的顺序即为特征的重要性排序,由于LSTM设计的循环结构的要求,需要输入特征向量组成的序列数据,构造样本数据集,利用LSTM模型来根据过去的一段时间数据来预测未来一段时间的数据,选定时间滞后组成的样本数据集后,使用一定时间范围的数据作为训练集,所有参数训练完成后,选用相关系数最高且绝对误差最小的模型作为最优预测模型。本发明以达到预测隧道灯具亮度衰减到照明细则规定的阈值的时间,从而提醒维修人员及时更换灯具,防止车辆进入隧道时安全事故发生。
-
公开(公告)号:CN113032827B
公开(公告)日:2023-09-19
申请号:CN202110301703.8
申请日:2021-03-22
Applicant: 东北大学
Abstract: 本发明属于大数据隐私保护领域,公开了一种基于区块链技术的论文同行评审方法。本发明首先基于盲签名和多方门限签名技术构建了审稿系统,将审稿结果以匿名的形式存储在区块链上。针对现有双盲机制的审稿人盗取投稿人论文中的想法(idea)后不可追溯的问题,本发明提供了一种基于可搜索加密技术的审查取证机制,保证在审稿人发表论文与其审核的论文相似的情况下,其审核论文的作者可对被怀疑的审稿人是否审查了此篇稿件进行取证,可搜索加密技术同时也保证了作者无法直接查询审稿人是谁,因此,在增加了取证功能的同时,双盲机制仍然有效。同时,本发明还采用了分布式密钥保证该权利不被滥用。
-
公开(公告)号:CN113033207B
公开(公告)日:2023-08-29
申请号:CN202110373760.7
申请日:2021-04-07
Applicant: 东北大学
IPC: G06F40/295 , G06F40/30 , G06N3/0464 , G06N3/047 , G06N3/08
Abstract: 本发明提供一种基于逐层感知机制的生物医学嵌套类型实体识别方法,涉及数据挖掘和自然语言处理技术领域。该方法包括基于向量模式的生物医学文本表示、基于循环神经网络的隐藏特征编码与解码、基于多任务逐层感知机制的嵌套类型实体识别。步骤1为生物医学文本表示步骤,利用一位编码法和预训练特征向量对文本单词构建字符特征和语义特征。步骤2为隐藏特征提取,利用循环神经网络和RELU激活函数对初始特征进行隐藏信息发现、编码与解码。步骤3为多任务逐层感知机制,利用归一化函数在步骤2基础上,识别简单实体,通过迭代组合方法,逐层感知识别嵌套类型实体。本发明可以对生物医学文本中的嵌套类型实体进行识别提取,并取得较好的效果。
-
公开(公告)号:CN113204559B
公开(公告)日:2023-07-28
申请号:CN202110569679.6
申请日:2021-05-25
Applicant: 东北大学
IPC: G06F16/22 , G06F16/2453 , G06F16/28 , G06F9/50
Abstract: 本发明提供一种GPU上的多维KD树优化方法,用于在GPU中加速KD索引的构建与查询过程;本发明从待划分数据集的全体出发,将传统KD树上的二等分划分操作视作一种可分配资源,并将这种资源称之为额度,从如何有效分配额度资源的角度,提出了一种GPU上优化KD树构建与查询过程的新方法和新技术;基于额度分配策略,贪心划分策略,通过提高每次排序的利用率,获得了更大的划分效率,加速了KD树构建过程,降低了KD树的深度;利用学习索引的思想优化了中间节点的参数访问方式,有效降低了批量查询过程中线程束的分化状况,优化了批量查询的性能。
-
-
-
-
-
-
-
-
-