环形架构数据库上预连接表的生成方法

    公开(公告)号:CN102323947A

    公开(公告)日:2012-01-18

    申请号:CN201110260847.X

    申请日:2011-09-05

    Applicant: 东北大学

    Abstract: 一种环形架构数据库上预连接表的生成方法,属于分布式数据存储领域,方法为:建立Key-Value数据库;构建关键列的列值索引并将其存储到数据库中;生成预连接表;若原数据表进行更新,则对相应预连接表进行更新;进行数据查询,输出查询结果;采用本发明的预连接表生成方法,可以在环形架构的Key-Value数据库中高效的生成预连接表,提供快速的连接查询功能;通过优化计算过程,降低了生成连接表的时间空间代价,加快了计算速度;同时根据更新维护方法,降低了查询延迟,可以提供实时的连接查询结果。

    一种基于主动深度学习的实体关系联合抽取方法及系统

    公开(公告)号:CN113901825B

    公开(公告)日:2024-05-03

    申请号:CN202111383783.2

    申请日:2021-11-22

    Applicant: 东北大学

    Abstract: 本发明提供一种基于主动深度学习的实体关系联合抽取方法及系统,涉及计算机自然语言处理技术领域。该方法首先获取待标注样本数据集作为语料库,并对语料库进行概念抽取,定义实体类别集合和关系类别集合;再使用基于主动学习的待标注采样方法进行样本采样,得到待标注样本数据集;并对待标注样本数据集使用改进EDA方法进行数据增强;然后根据定义的实体和关系类别集合,在待标注样本数据集的数据上采用BIO‑OVE/R‑HT标注策略进行标注;最后将标注的数据输入到实体关系联合抽取模型进行训练。使用模型进行预测时,对预测得到的标签使用和标注策略对应的解码规则解码得到三元组。该系统进行实体关系抽取的同时并将抽取的实体关系快速构建知识图谱并且进行管理。

    一种基于主动深度学习的实体关系联合抽取方法及系统

    公开(公告)号:CN113901825A

    公开(公告)日:2022-01-07

    申请号:CN202111383783.2

    申请日:2021-11-22

    Applicant: 东北大学

    Abstract: 本发明提供一种基于主动深度学习的实体关系联合抽取方法及系统,涉及计算机自然语言处理技术领域。该方法首先获取待标注样本数据集作为语料库,并对语料库进行概念抽取,定义实体类别集合和关系类别集合;再使用基于主动学习的待标注采样方法进行样本采样,得到待标注样本数据集;并对待标注样本数据集使用改进EDA方法进行数据增强;然后根据定义的实体和关系类别集合,在待标注样本数据集的数据上采用BIO‑OVE/R‑HT标注策略进行标注;最后将标注的数据输入到实体关系联合抽取模型进行训练。使用模型进行预测时,对预测得到的标签使用和标注策略对应的解码规则解码得到三元组。该系统进行实体关系抽取的同时并将抽取的实体关系快速构建知识图谱并且进行管理。

    一种基于时频复合学习的长期时间序列预测方法

    公开(公告)号:CN117951641A

    公开(公告)日:2024-04-30

    申请号:CN202410124656.8

    申请日:2024-01-30

    Applicant: 东北大学

    Abstract: 本发明提供一种基于时频复合学习的长期时间序列预测方法,涉及时间序列预测技术领域,本发明通过特定的模型结构设计和时‑频‑复合损失函数以实现时频复合学习的长期时间序列预测。其中,模型结构包含两个部分Trend Block和Season Block。Trend Block通过利用趋势分解和线性插值映射等技术,可有效的从数据集中所包含的趋势信息在时域模式下学习出与未来时间步在时域模式下的映射关系,Season Block则是通过利用多头频率增强和多头频率信息融合映射等技术,有效地从数据中所包含的季节信息在频率模式下学习出与未来时间步在频域模式下的映射关系。时‑频‑复合损失函数的设计包含频域和时域两个部分,以辅助模型分别学习频域和时域模式下的映射关系。

    面向流数据处理的分级存储容错方法

    公开(公告)号:CN112799597A

    公开(公告)日:2021-05-14

    申请号:CN202110170616.3

    申请日:2021-02-08

    Applicant: 东北大学

    Abstract: 本发明提供一种面向流数据处理的分级存储容错方法,涉及流数据处理技术领域。该方法基于Kafka系统,采用HDD与SSD混合存储的二级存储结构,SSD为性能层、HDD为存储层,通过热数据识别算法建立相应的分级存储策略;热数据识别算法包括LFU算法与LRU算法,分别用于防止数据频繁迁移和判断热数据;分级存储策略包括自判断分级存储、Leader—Follower分级存储和自定义分级存储。本发明针对容错子系统在I/O操作和搜索效率问题,开展关于容错子系统和Kafka整体系统存储策略的研究,并实现流数据存储的相关优化和Kafka系统进行分级存储的策略迭代,进一步提升其延迟低、吞吐量高的优点。

    一种并行环境下的有向图可达性链表生成及查询方法

    公开(公告)号:CN103399902A

    公开(公告)日:2013-11-20

    申请号:CN201310317126.7

    申请日:2013-07-23

    Applicant: 东北大学

    Abstract: 一种并行环境下的有向图可达性链表生成及查询方法,属于大图数据处理领域。将一个有向图分发到各个处理机中,每个处理机存储图中的节点及节点所对应的子节点;将分割到各个处理机内的图数据压缩;计算主干图上主干节点可达性编码;构建链式索引;在链式索引上建立跳表;各处理机间进行数据通信:各处理机向其他处理机发送跳表信息;各处理机更新自身的跳表信息;建立全图可达性索引。本发明通并行环境下的图可达性压缩技术,极大降低图数据大小、降低系统计算负载,使得系统处理更大规模的图数据。本发明提高从磁盘上读取数据的速度,间接加快查询速度,保证查询结果准确性,极大降低并行计算系统在查询时的网路通信代价和查询时间。

Patent Agency Ranking