-
公开(公告)号:CN111782659B
公开(公告)日:2023-10-17
申请号:CN202010663640.6
申请日:2020-07-10
Applicant: 东北大学
IPC: G06F16/22 , G06F16/23 , G06F16/245 , G06F16/28
Abstract: 本发明适用于计算机领域,提供了一种数据库索引创建方法、装置、计算机设备和存储介质,其中,所述一种数据库索引创建方法包括获取第一索引与检索条件,以及根据所述检索条件对所述第一索引进行调整得到目标索引,所述检索条件至少包含检索目标的上界和下界。本发明实施例提供的一种数据库索引创建方法,通过第一索引实现对数据的快速访问,第一索引是根据数据库中存储的数据预先构建的索引,具有较短的初始化时间,同时,根据检索条件对第一索引进行调整得到目标索引,通过不断查询自适应的构建索引,最终形成一个完整的索引,解决了一次性构建的完整索引在初始化阶段等待耗时过长的问题。
-
公开(公告)号:CN116828077A
公开(公告)日:2023-09-29
申请号:CN202310825661.7
申请日:2023-07-06
Applicant: 东北大学
Abstract: 本发明设计一种零停机一致性协议切换方法,属于分布式系统共识技术领域;由一致性协议调度层和多个一致性协议两部分实现;为每个客户端请求添加唯一命令序列号McpSeqNo和一致性协议标签McpProcessedBy在一致性协议调度层中使用;序列号McpSeqNo在一致性协议调度层中是递增的,当状态机在执行命令时,会跟踪保存每一个客户端已经被执行过的最近的也即是最大的序列号;当状态机开始执行一条日志里边的命令时,一致性协议调度层比较其序列号,查看是否为待执行的下一条命令,如果是则直接执行,否则就忽略掉这个命令,返回上次执行此命令的结果;从而能够对动态变化的工作负载进行动态选择不同的一致性协议,使得协议过渡期间是可容错的。
-
公开(公告)号:CN113010525B
公开(公告)日:2023-08-01
申请号:CN202110354512.8
申请日:2021-04-01
Applicant: 东北大学
IPC: G06F16/22 , G06F16/215 , G06F16/2455 , G06F16/27 , G06F18/2413 , G06F18/213 , G06N3/0464 , G06N3/049
Abstract: 本发明提供一种基于PID的海洋时空大数据并行KNN查询处理方法,涉及时空大数据管理技术领域。该方法首次引入工业界广泛使用的PID控制器技术,实现了基于反馈机制的变步长查找处理。首先对获取到的海洋数据进行预处理,并采用网格划分方法实现对数据的划分,在此基础上,采用网格索引技术来索引预处理后的海洋数据;采用行排序方式对每个网格单元进行编码;通过使用行排序网格索引,判断出哪些行和列是在圆的半径范围内,从而直接判断是否和圆有交集;在进行KNN查询时,利用PID系统具有的可调节性,通过负反馈动态调整搜索的范围,实现KNN查询处理中查询半径的动态预测,减少了KNN查询次数,从而加快了KNN查询处理速度。
-
公开(公告)号:CN110472115B
公开(公告)日:2022-08-02
申请号:CN201910728636.0
申请日:2019-08-08
Applicant: 东北大学
IPC: G06F16/9035 , G06F16/906 , G06F16/951 , G06Q50/00
Abstract: 本发明提供一种基于深度学习的社交网络文本情感细粒度分类方法,涉及情感多分类领域,本发明使用Scrapy框架爬取社交网络文本数据,进行数据清洗、分词,将分词结果作为word2vec的输入进行词向量转化;基于CNN模型进行文本的情感8分类,将词向量转化结果作为CNN嵌入层的输入,进行卷积、池化、概率计算等前向、反向传播过程训练模型,实现对网络评论情感分类的迁移学习,对社交网络文本进行二轮抽样实现实例迁移、训练分类器,并对评论进行情感预测;对前述工作进行系统设计,对分析结果进行可视化展示,利用MVC三层架构设计展示模块,并针对单文本或多文本情感细粒度分类、跨平台迁移学习文本情感细粒度分类、社交网络热度地图等三方面功能对界面进行设计。
-
公开(公告)号:CN108133330B
公开(公告)日:2022-04-08
申请号:CN201810032010.1
申请日:2018-01-12
Applicant: 东北大学
IPC: G06Q10/06 , G06F16/9536 , G06Q50/00
Abstract: 本发明公开了一种面向社交众包任务分配方法及其系统,包括根据任务发布者发布的众包任务,对工作者以及所述众包任务进行匹配度估计算法计算,得到众包任务匹配度最高的一组工作者;采用贪心算法对任务分配进行计算,在众包任务匹配度最高的一组工作者中,选择整体匹配度之和最大的一组工作者作为最后的分配结果,以使得每个任务具有不同的待分配工作者,等待工作者成员领取任务,完成众包任务分配,增加了任务推荐的兴趣等信息的参考关系,使得任务推荐更加的高效,准确,并且,提高了算法性能,提高众包服务的质量。
-
公开(公告)号:CN110472014B
公开(公告)日:2022-02-22
申请号:CN201910729469.1
申请日:2019-08-08
Applicant: 东北大学
Abstract: 本发明提供一种面向社交网络文本基于识别新词旧义的情感分类方法,涉及情感分析技术领域,本发明使用词语的相邻词语计算条件熵值,以识别语境变化,提出了基于条件熵识别语境的DCC‑CE算法,通过DCC‑CE算法识别语境变化并结合词语共现度,来解决旧词新义识别以及新词发现问题,由此提出基于共现度识别旧词新义相关新词的DNEW‑DCC算法,将DCC‑CE和DNEW‑DCC算法作为旧词新义识别的步骤添加到情感分类中,以改善旧词新义对情感分类准确度的影响,并由此提出通过旧词新义改善情感分类的NMOW‑AC算法。
-
公开(公告)号:CN113010525A
公开(公告)日:2021-06-22
申请号:CN202110354512.8
申请日:2021-04-01
Applicant: 东北大学
IPC: G06F16/22 , G06F16/215 , G06F16/2455 , G06F16/27 , G06K9/62 , G06N3/04
Abstract: 本发明提供一种基于PID的海洋时空大数据并行KNN查询处理方法,涉及时空大数据管理技术领域。该方法首次引入工业界广泛使用的PID控制器技术,实现了基于反馈机制的变步长查找处理。首先对获取到的海洋数据进行预处理,并采用网格划分方法实现对数据的划分,在此基础上,采用网格索引技术来索引预处理后的海洋数据;采用行排序方式对每个网格单元进行编码;通过使用行排序网格索引,判断出哪些行和列是在圆的半径范围内,从而直接判断是否和圆有交集;在进行KNN查询时,利用PID系统具有的可调节性,通过负反馈动态调整搜索的范围,实现KNN查询处理中查询半径的动态预测,减少了KNN查询次数,从而加快了KNN查询处理速度。
-
公开(公告)号:CN112182152A
公开(公告)日:2021-01-05
申请号:CN202011013190.2
申请日:2020-09-24
Applicant: 东北大学
IPC: G06F16/33 , G06F16/35 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明提供提出了基于深度学习的新浪微博用户情感影响力分析方法,包括数据获取、数据预处理、构建多元情感特征词向量、文本进行情感分类和定义微博用户情感影响力,本发明中通过使用MSF‑CNN算法对微博文本进行情感分析能力高于w2c‑CNN算法,能很好的配合微博中书写自由、用词随意的语言环境,能很好的考虑微博文本的上下语境,提取出文本特征,同时考虑词语自身所携带的情感,能更好的进行情感分类。
-
公开(公告)号:CN112181617A
公开(公告)日:2021-01-05
申请号:CN202010979603.6
申请日:2020-09-17
Applicant: 东北大学
Abstract: 本发明公开了一种基于特定索引结构的高效调度算法,由一个特殊的布隆过滤器和每个过滤器元素对应的事务队列组成,所述布隆过滤器和事务队列组成特殊的索引结构,其分别进行高效的依赖检测和保留必要的依赖信息,通过布隆过滤器,在一定时间内检测出事务之间的依赖关系,事务队列具有保持总顺序关系和简化依赖关系图的特性,借助于索引结构,调度器支持记录粒度锁,从而支持并发事务调度操作。本发明提出的方法高效的解决了依赖图调度中由于基于两两比较而调度开销过大导致的性能损失问题,保证了在各种依赖率工作负载下的并行执行能力,正式证明了副本调度与其他调度安全的一致性,调度器比对比方法具有更高的效率、可扩展性和健壮性。
-
公开(公告)号:CN107103055B
公开(公告)日:2020-05-12
申请号:CN201710237896.9
申请日:2017-03-29
Applicant: 东北大学
Abstract: 本发明公开一种面向内存更新密集型程序的Hourglass和Piggyback算法,其优秀性能来源于在updater和dumper线程之间的指针交换技术,可以避免大量数据拷贝。它周期性的发生updater和dumper线程的角色交换,可以被周期性无止境的复用,一旦上面的部分为空的时候交换上下角色。可以拥有更少的内存和基本没有抖动的延时效果。其都属于轻量级检查点算法的一种,Hourglass结合了目前最好的两个算法zigzag和pingpong,从而利用两个的优点指针交换和比特位标志。Piggyback算法提高性能通过提供一种全量快照,从而可以支持实时olap和oltp的应用。其具有更小的内存占用、全量快照开销、更小的延时、更均匀的延时的优点。
-
-
-
-
-
-
-
-
-