-
公开(公告)号:CN111046092A
公开(公告)日:2020-04-21
申请号:CN201911057101.1
申请日:2019-11-01
Applicant: 东北大学
IPC: G06F16/25 , G06F16/22 , G06F15/163
Abstract: 本发明公开一种基于CPU-GPU异构体系结构的并行相似性连接方法,属于计算机数据库技术与并行计算技术领域。该方法通过对数据相似性连接方法进行分析设计,构建新的倒排索引结构,实现在GPU上并行构建倒排索引,对相似性连接方法进行分解,根据两种处理器不同的计算特性重新设计计算过程,基于GPU实现双重前缀过滤,有效减小候选集体积。本发明提供的基于CPU-GPU异构体系结构的相似性连接方法能够将传统的数据相似性连接准确地转换到CPU-GPU异构计算体系上,从而有效提高大规模数据集相似性连接的处理效率。
-
公开(公告)号:CN110598061A
公开(公告)日:2019-12-20
申请号:CN201910893511.3
申请日:2019-09-20
Applicant: 东北大学
IPC: G06F16/901 , G06F16/951 , G06K9/62
Abstract: 本发明公开一种多元图融合的异构信息网嵌入方法,包括以下步骤:1)元图发现:根据异构信息网的特性选择频繁元图集合,以涵盖网络的重要语义特征;2)基于多元图融合的网络嵌入:利用适用于非对称元图的相似度度量方法计算异构信息网节点的相似度矩阵,并将该矩阵作为后续嵌入模型的原始特征;3)利用神经网络进行节点嵌入。采用本发明的异构网络嵌入方法,一方面,可以挖掘代表当前网络结构和语义特征的重要元图;一方面,提出的基于元图的节点相似度度量方法更具有通用性,并且通过原始特征的降维和融合,可以根据当前网络的特性计算不同元图的重要性,提高嵌入的准确性。
-
公开(公告)号:CN109165224A
公开(公告)日:2019-01-08
申请号:CN201810971875.4
申请日:2018-08-24
Applicant: 东北大学
CPC classification number: G06F21/64 , G06F21/6227 , G06Q20/3829
Abstract: 本发明提供一种在区块链数据库上针对关键字key的索引方法,涉及区块链数据查询技术领域。该方法首先普通节点根据用户输入的带关键字key的原始数据生成交易记录;存储节点将交易打包到区块中;将区块数据追加写入磁盘文件;根据key值查询交易数据,输出查询结果;普通用户对结果进行可信性验证。本发明直接根据数据关键字进行索引,实现数据的可查询性;将传统区块链中的交易结构扩展到可存储类似于传统数据库的模式结构,提高适用性;根据数字签名技术管理数据权限,提高数据安全性;根据MerkleRBTree自我感知索引是否被篡改,根据交易哈希感知交易是否被篡改,从而保证数据不可篡改性;同时实现轻量级节点的数据验证功能,使得查询端能有效检测数据可信性。
-
公开(公告)号:CN107169033A
公开(公告)日:2017-09-15
申请号:CN201710249567.6
申请日:2017-04-17
IPC: G06F17/30
Abstract: 本发明提供一种基于数据模式转换和并行框架的关系数据查询优化方法,涉及计算机数据库技术领域。该方法通过对关系模型数据上复杂查询语句进行结构分析,构建新的数据存储结构,实现在数据存储上的转换处理,将关系模型数据库中存储的数据转存到新的数据模式存储系统中,针对数据模式的变化进行相应查询语句的转换,基于SPARK SQL查询生成SPARK任务并执行该任务。本发明提供的关系数据查询优化方法能够将关系数据库中的数据针对查询的特征准确地转换到SPARK并行查询处理框架之上,从而有效提高对关系数据库上部分频繁执行的复杂查询的处理效率。
-
公开(公告)号:CN104158840A
公开(公告)日:2014-11-19
申请号:CN201410323742.8
申请日:2014-07-09
Applicant: 东北大学
Abstract: 一种分布式计算图节点相似度的方法,属于计算机数据挖掘领域,包括:采用主从模式搭建分布式计算平台;主计算机读入对象数据,建立图模型并发送给各子计算机;主计算机进行任务划分,并将各子任务分配给各子计算机;各子计算机计算其各任务节点分别传递给图模型中节点对的相似度增量计算值;主计算机计算偏移系数并分别发送给对应的各子计算机;子计算机对本地各任务节点的相似度增量计算值进行修正,并将修正后的本地各任务节点的相似度增量进行求和后传送给主计算机;主计算机对图模型中各节点对的相似度进行整合,最终得到图模型中各个节点对的相似度;该方法相比于传统SimRank计算方法,传输代价低,计算时间短,效率明显提高。
-
公开(公告)号:CN102323947B
公开(公告)日:2013-07-10
申请号:CN201110260847.X
申请日:2011-09-05
Applicant: 东北大学
IPC: G06F17/30
Abstract: 一种环形架构数据库上预连接表的生成方法,属于分布式数据存储领域,方法为:建立Key-Value数据库;构建关键列的列值索引并将其存储到数据库中;生成预连接表;若原数据表进行更新,则对相应预连接表进行更新;进行数据查询,输出查询结果;采用本发明的预连接表生成方法,可以在环形架构的Key-Value数据库中高效的生成预连接表,提供快速的连接查询功能;通过优化计算过程,降低了生成连接表的时间空间代价,加快了计算速度;同时根据更新维护方法,降低了查询延迟,可以提供实时的连接查询结果。
-
公开(公告)号:CN119886365A
公开(公告)日:2025-04-25
申请号:CN202411934244.7
申请日:2024-12-26
Applicant: 东北大学
IPC: G06N5/045 , G06N5/022 , G06N5/01 , G06N20/00 , G06N3/0499 , G06F16/9536 , G06F16/9538 , G06Q30/0601
Abstract: 本发明属于路径推理可解释推荐技术领域,公开一种基于反事实路径增强的强化推理可解释推荐方法及其评估方法。通过反事实推理学习用户对候选路径及其内部关系的可信度,以从细粒度视角区分用户对不同路径的偏好,从而能够选择最符合用户偏好的路径作为解释。此外,设计一种双奖励的强化学习方法用于生成推荐和解释,将路径导向的奖励与物品导向的奖励相结合,以同时提升模型的准确性和可解释性。最后提出了广泛且可量化的评估指标,即稳定性和有效性,可以更有效地评估模型的可解释性质量。
-
公开(公告)号:CN112199334B
公开(公告)日:2023-12-05
申请号:CN202011146473.4
申请日:2020-10-23
Applicant: 东北大学
IPC: G06F16/13 , G06F16/172 , G06F16/182 , G06F9/54
Abstract: 本发明提供了一种基于消息队列的数据流处理检查点文件存储的方法及装置,其中该方法根据流式计算中产生的用于保存中间状态的检查点文件进行特征分析,将其存储结构与消息队列消息队列的存储模型进行逻辑适配,设计文件操作接口与消息操作接口的映射关系,使用Zookeeper保存映射关系元信息部分;自定义分布式文件系统协议,提供依赖库的无服务形式被上游流式处理应用所依赖,以一种对用户透明的运行方式,根据实现的映射规则将检查点数据路由到对应的消息队列存储结构中,当流式应用重启时,根据Zookeeper中的元信息获取到消息队列中相应的状态数据,进行任务恢复以实现数据流计算框架容错机制。
-
公开(公告)号:CN113420215A
公开(公告)日:2021-09-21
申请号:CN202110698835.9
申请日:2021-06-23
Applicant: 东北大学
IPC: G06F16/9535 , G06F16/9536 , G06Q50/00
Abstract: 本发明提供一种面向兴趣点推荐的可解释生成方法,涉及社交网络以及兴趣点推荐技术领域。首先根据兴趣点推荐模型获取用户ID及推荐的兴趣点,以及兴趣点对应的影响因素;再根据兴趣点影响因素之间的标量投影,进行兴趣点影响因素之间的融合;将多个融合后的影响因素与推荐的兴趣点将多个融合后的影响因素与推荐的兴趣点进行相似性学习,得到融合后的影响因素与推荐的兴趣点间的相似性权重;根据相似性权重值,确定影响兴趣点推荐的主要影响因素;最后采用设定好的句子模板,基于主要影响因素对推荐的兴趣点进行句子解释;该方法对推荐的兴趣点的不同影响因素进行分析,在既保证推荐模型的准确率的同时,又保证了解释的合理性。
-
公开(公告)号:CN113033207A
公开(公告)日:2021-06-25
申请号:CN202110373760.7
申请日:2021-04-07
Applicant: 东北大学
IPC: G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种基于逐层感知机制的生物医学嵌套类型实体识别方法,涉及数据挖掘和自然语言处理技术领域。该方法包括基于向量模式的生物医学文本表示、基于循环神经网络的隐藏特征编码与解码、基于多任务逐层感知机制的嵌套类型实体识别。步骤1为生物医学文本表示步骤,利用一位编码法和预训练特征向量对文本单词构建字符特征和语义特征。步骤2为隐藏特征提取,利用循环神经网络和RELU激活函数对初始特征进行隐藏信息发现、编码与解码。步骤3为多任务逐层感知机制,利用归一化函数在步骤2基础上,识别简单实体,通过迭代组合方法,逐层感知识别嵌套类型实体。本发明可以对生物医学文本中的嵌套类型实体进行识别提取,并取得较好的效果。
-
-
-
-
-
-
-
-
-