-
公开(公告)号:CN102323947A
公开(公告)日:2012-01-18
申请号:CN201110260847.X
申请日:2011-09-05
Applicant: 东北大学
IPC: G06F17/30
Abstract: 一种环形架构数据库上预连接表的生成方法,属于分布式数据存储领域,方法为:建立Key-Value数据库;构建关键列的列值索引并将其存储到数据库中;生成预连接表;若原数据表进行更新,则对相应预连接表进行更新;进行数据查询,输出查询结果;采用本发明的预连接表生成方法,可以在环形架构的Key-Value数据库中高效的生成预连接表,提供快速的连接查询功能;通过优化计算过程,降低了生成连接表的时间空间代价,加快了计算速度;同时根据更新维护方法,降低了查询延迟,可以提供实时的连接查询结果。
-
公开(公告)号:CN113901825B
公开(公告)日:2024-05-03
申请号:CN202111383783.2
申请日:2021-11-22
Applicant: 东北大学
IPC: G06F40/295 , G06F40/247 , G06F40/194 , G06F18/214 , G06N3/08 , G06F16/36 , G06F16/35 , G06N3/0455 , G06N3/0442
Abstract: 本发明提供一种基于主动深度学习的实体关系联合抽取方法及系统,涉及计算机自然语言处理技术领域。该方法首先获取待标注样本数据集作为语料库,并对语料库进行概念抽取,定义实体类别集合和关系类别集合;再使用基于主动学习的待标注采样方法进行样本采样,得到待标注样本数据集;并对待标注样本数据集使用改进EDA方法进行数据增强;然后根据定义的实体和关系类别集合,在待标注样本数据集的数据上采用BIO‑OVE/R‑HT标注策略进行标注;最后将标注的数据输入到实体关系联合抽取模型进行训练。使用模型进行预测时,对预测得到的标签使用和标注策略对应的解码规则解码得到三元组。该系统进行实体关系抽取的同时并将抽取的实体关系快速构建知识图谱并且进行管理。
-
公开(公告)号:CN113901825A
公开(公告)日:2022-01-07
申请号:CN202111383783.2
申请日:2021-11-22
Applicant: 东北大学
IPC: G06F40/295 , G06F40/247 , G06F40/194 , G06K9/62 , G06N3/08 , G06F16/36 , G06F16/35
Abstract: 本发明提供一种基于主动深度学习的实体关系联合抽取方法及系统,涉及计算机自然语言处理技术领域。该方法首先获取待标注样本数据集作为语料库,并对语料库进行概念抽取,定义实体类别集合和关系类别集合;再使用基于主动学习的待标注采样方法进行样本采样,得到待标注样本数据集;并对待标注样本数据集使用改进EDA方法进行数据增强;然后根据定义的实体和关系类别集合,在待标注样本数据集的数据上采用BIO‑OVE/R‑HT标注策略进行标注;最后将标注的数据输入到实体关系联合抽取模型进行训练。使用模型进行预测时,对预测得到的标签使用和标注策略对应的解码规则解码得到三元组。该系统进行实体关系抽取的同时并将抽取的实体关系快速构建知识图谱并且进行管理。
-
公开(公告)号:CN107590742A
公开(公告)日:2018-01-16
申请号:CN201710957182.5
申请日:2017-10-16
Applicant: 东北大学
Inventor: 赵志滨 , 姚兰 , 于戈 , 鲍玉斌 , 陈郭成 , 刘佳良 , 张天成 , 李芳芳 , 许存立 , 刘欢 , 王勋 , 储佳红 , 唐梦娇 , 徐瑛蔚 , 李壮 , 王宗怡 , 石玉鑫 , 梁睿博 , 杨泽清 , 赵永恒 , 关亨 , 王思远 , 吴永琪 , 华钰 , 高若涵
IPC: G06Q50/00
Abstract: 本发明公开了一种基于行为的社交网络用户属性值反演方法,基于行为的用户属性值反演方法的思想是针对反演对象在社交网络多话题下的评论行为,发现与反演对象具有相似网络行为的人群,再利用群体属性值与个体属性值之间的映射策略以及带权重的投票机制,对网络用户的属性值进行推测并将结果赋给反演对象。这种方法一方面可以动态填补和修正用户属性信息中所存在的缺失值、错误值;更进一步可以为社交网络中的个性化推荐提供更为可靠的原始数据。提高网络用户信息的准确性,最终达到动态填补和修正网络用户属性缺失值和错误值的目的。
-
公开(公告)号:CN117975267A
公开(公告)日:2024-05-03
申请号:CN202410124654.9
申请日:2024-01-30
Applicant: 东北大学
IPC: G06V20/10 , G06V10/80 , G06V10/52 , G06V10/82 , G06V10/44 , G06V10/771 , G06V10/62 , G06N3/045 , G06N3/0464
Abstract: 本发明提供一种基于孪生多尺度交叉注意的遥感影像变化检测方法,涉及变化检测技术领域,本发明通过在特征提取阶段加入CBAM轻量级注意力模块,使网络的特征提取及表达能力显著提高,同时将不同层次的多尺度特征进行融合,充分挖掘双时相遥感图像的语义特征信息,减少编码器连续下采样细节丢失的影响,然后使用交叉注意力进一步筛选有效特征,捕获两个时相图像之间的交互信息,滤除伪变化信息,解决目前现有变化检测方法中存在的像素边缘检测不准确和细小目标遗漏的问题。
-
公开(公告)号:CN117951641A
公开(公告)日:2024-04-30
申请号:CN202410124656.8
申请日:2024-01-30
Applicant: 东北大学
IPC: G06F18/25 , G06F18/2131 , G06F18/213 , G06F18/214 , G06F123/02
Abstract: 本发明提供一种基于时频复合学习的长期时间序列预测方法,涉及时间序列预测技术领域,本发明通过特定的模型结构设计和时‑频‑复合损失函数以实现时频复合学习的长期时间序列预测。其中,模型结构包含两个部分Trend Block和Season Block。Trend Block通过利用趋势分解和线性插值映射等技术,可有效的从数据集中所包含的趋势信息在时域模式下学习出与未来时间步在时域模式下的映射关系,Season Block则是通过利用多头频率增强和多头频率信息融合映射等技术,有效地从数据中所包含的季节信息在频率模式下学习出与未来时间步在频域模式下的映射关系。时‑频‑复合损失函数的设计包含频域和时域两个部分,以辅助模型分别学习频域和时域模式下的映射关系。
-
公开(公告)号:CN107622461B
公开(公告)日:2021-06-22
申请号:CN201710846394.6
申请日:2017-09-19
Applicant: 东北大学
Inventor: 赵志滨 , 姚兰 , 聂亦澄 , 于戈 , 鲍玉斌 , 陈郭成 , 刘佳良 , 张天成 , 李芳芳 , 许存立 , 刘欢 , 王勋 , 储佳红 , 唐梦娇 , 徐瑛蔚 , 李壮 , 王宗怡 , 石玉鑫 , 梁睿博 , 杨泽清 , 赵永恒 , 关亨 , 王思远 , 吴永琪 , 华钰 , 高若涵
Abstract: 本发明公开了一种面向慕课系统的作业主观题互评方法,根据作业的内容和知识点与评阅人的相关属性,将待评的作业权衡分配给评阅人,构建作业与评阅人的分配情况用带权重二部图;评阅人对作业根据评分要求进行评分;将同一作业各位评阅人的评分综合起来后取平均值,作为最终成绩。通过全面的考虑作业内容和知识点与评阅人的相关性,将待互评的作业权衡分配,对互评过程中的作业与阅卷者进行合理的匹配,能够实现评阅任务的合理分配,并且保证作业评阅的质量。
-
公开(公告)号:CN107590742B
公开(公告)日:2021-06-22
申请号:CN201710957182.5
申请日:2017-10-16
Applicant: 东北大学
Inventor: 赵志滨 , 姚兰 , 于戈 , 鲍玉斌 , 陈郭成 , 刘佳良 , 张天成 , 李芳芳 , 许存立 , 刘欢 , 王勋 , 储佳红 , 唐梦娇 , 徐瑛蔚 , 李壮 , 王宗怡 , 石玉鑫 , 梁睿博 , 杨泽清 , 赵永恒 , 关亨 , 王思远 , 吴永琪 , 华钰 , 高若涵
IPC: G06Q50/00
Abstract: 本发明公开了一种基于行为的社交网络用户属性值反演方法,基于行为的用户属性值反演方法的思想是针对反演对象在社交网络多话题下的评论行为,发现与反演对象具有相似网络行为的人群,再利用群体属性值与个体属性值之间的映射策略以及带权重的投票机制,对网络用户的属性值进行推测并将结果赋给反演对象。这种方法一方面可以动态填补和修正用户属性信息中所存在的缺失值、错误值;更进一步可以为社交网络中的个性化推荐提供更为可靠的原始数据。提高网络用户信息的准确性,最终达到动态填补和修正网络用户属性缺失值和错误值的目的。
-
公开(公告)号:CN112799597A
公开(公告)日:2021-05-14
申请号:CN202110170616.3
申请日:2021-02-08
Applicant: 东北大学
IPC: G06F3/06
Abstract: 本发明提供一种面向流数据处理的分级存储容错方法,涉及流数据处理技术领域。该方法基于Kafka系统,采用HDD与SSD混合存储的二级存储结构,SSD为性能层、HDD为存储层,通过热数据识别算法建立相应的分级存储策略;热数据识别算法包括LFU算法与LRU算法,分别用于防止数据频繁迁移和判断热数据;分级存储策略包括自判断分级存储、Leader—Follower分级存储和自定义分级存储。本发明针对容错子系统在I/O操作和搜索效率问题,开展关于容错子系统和Kafka整体系统存储策略的研究,并实现流数据存储的相关优化和Kafka系统进行分级存储的策略迭代,进一步提升其延迟低、吞吐量高的优点。
-
公开(公告)号:CN103399902A
公开(公告)日:2013-11-20
申请号:CN201310317126.7
申请日:2013-07-23
Applicant: 东北大学
IPC: G06F17/30
Abstract: 一种并行环境下的有向图可达性链表生成及查询方法,属于大图数据处理领域。将一个有向图分发到各个处理机中,每个处理机存储图中的节点及节点所对应的子节点;将分割到各个处理机内的图数据压缩;计算主干图上主干节点可达性编码;构建链式索引;在链式索引上建立跳表;各处理机间进行数据通信:各处理机向其他处理机发送跳表信息;各处理机更新自身的跳表信息;建立全图可达性索引。本发明通并行环境下的图可达性压缩技术,极大降低图数据大小、降低系统计算负载,使得系统处理更大规模的图数据。本发明提高从磁盘上读取数据的速度,间接加快查询速度,保证查询结果准确性,极大降低并行计算系统在查询时的网路通信代价和查询时间。
-
-
-
-
-
-
-
-
-