-
公开(公告)号:CN119903157A
公开(公告)日:2025-04-29
申请号:CN202510070177.7
申请日:2025-01-16
Applicant: 东北大学
IPC: G06F16/3329 , G06F16/36 , G06F18/24 , G06F18/25 , G06F18/214 , G06F40/35 , G06N3/0455 , G06N3/0442 , G06N3/0499 , G06N3/042 , G06N3/0895 , G06N5/04 , G06F17/16 , G06F17/18
Abstract: 本发明提供一种融合知识和情绪原因语境图的共情对话生成方法,涉及信息处理技术领域。本发明提出融合知识和情绪原因语境图的共情对话生成模型,该模型包括话语编码、融合知识的对话语境图、知识增强的KDCG网络、情绪分类、情绪原因识别以及回复生成六个模块,通过引入情绪原因语境图来有效解决多轮对话中的语境信息整合问题,通过引入知识库中的背景知识结合情绪原因语境图来提升系统对隐含表达情绪和意图的理解能力,最终全面提升对话系统对用户情绪的理解深度。通过情绪和原因的共同建模,让系统更加明确地理解用户的情绪来源,从而生成更具有针对性和人性化的共情响应。
-
公开(公告)号:CN111782659B
公开(公告)日:2023-10-17
申请号:CN202010663640.6
申请日:2020-07-10
Applicant: 东北大学
IPC: G06F16/22 , G06F16/23 , G06F16/245 , G06F16/28
Abstract: 本发明适用于计算机领域,提供了一种数据库索引创建方法、装置、计算机设备和存储介质,其中,所述一种数据库索引创建方法包括获取第一索引与检索条件,以及根据所述检索条件对所述第一索引进行调整得到目标索引,所述检索条件至少包含检索目标的上界和下界。本发明实施例提供的一种数据库索引创建方法,通过第一索引实现对数据的快速访问,第一索引是根据数据库中存储的数据预先构建的索引,具有较短的初始化时间,同时,根据检索条件对第一索引进行调整得到目标索引,通过不断查询自适应的构建索引,最终形成一个完整的索引,解决了一次性构建的完整索引在初始化阶段等待耗时过长的问题。
-
公开(公告)号:CN113010525B
公开(公告)日:2023-08-01
申请号:CN202110354512.8
申请日:2021-04-01
Applicant: 东北大学
IPC: G06F16/22 , G06F16/215 , G06F16/2455 , G06F16/27 , G06F18/2413 , G06F18/213 , G06N3/0464 , G06N3/049
Abstract: 本发明提供一种基于PID的海洋时空大数据并行KNN查询处理方法,涉及时空大数据管理技术领域。该方法首次引入工业界广泛使用的PID控制器技术,实现了基于反馈机制的变步长查找处理。首先对获取到的海洋数据进行预处理,并采用网格划分方法实现对数据的划分,在此基础上,采用网格索引技术来索引预处理后的海洋数据;采用行排序方式对每个网格单元进行编码;通过使用行排序网格索引,判断出哪些行和列是在圆的半径范围内,从而直接判断是否和圆有交集;在进行KNN查询时,利用PID系统具有的可调节性,通过负反馈动态调整搜索的范围,实现KNN查询处理中查询半径的动态预测,减少了KNN查询次数,从而加快了KNN查询处理速度。
-
公开(公告)号:CN110472115B
公开(公告)日:2022-08-02
申请号:CN201910728636.0
申请日:2019-08-08
Applicant: 东北大学
IPC: G06F16/9035 , G06F16/906 , G06F16/951 , G06Q50/00
Abstract: 本发明提供一种基于深度学习的社交网络文本情感细粒度分类方法,涉及情感多分类领域,本发明使用Scrapy框架爬取社交网络文本数据,进行数据清洗、分词,将分词结果作为word2vec的输入进行词向量转化;基于CNN模型进行文本的情感8分类,将词向量转化结果作为CNN嵌入层的输入,进行卷积、池化、概率计算等前向、反向传播过程训练模型,实现对网络评论情感分类的迁移学习,对社交网络文本进行二轮抽样实现实例迁移、训练分类器,并对评论进行情感预测;对前述工作进行系统设计,对分析结果进行可视化展示,利用MVC三层架构设计展示模块,并针对单文本或多文本情感细粒度分类、跨平台迁移学习文本情感细粒度分类、社交网络热度地图等三方面功能对界面进行设计。
-
公开(公告)号:CN110472014B
公开(公告)日:2022-02-22
申请号:CN201910729469.1
申请日:2019-08-08
Applicant: 东北大学
Abstract: 本发明提供一种面向社交网络文本基于识别新词旧义的情感分类方法,涉及情感分析技术领域,本发明使用词语的相邻词语计算条件熵值,以识别语境变化,提出了基于条件熵识别语境的DCC‑CE算法,通过DCC‑CE算法识别语境变化并结合词语共现度,来解决旧词新义识别以及新词发现问题,由此提出基于共现度识别旧词新义相关新词的DNEW‑DCC算法,将DCC‑CE和DNEW‑DCC算法作为旧词新义识别的步骤添加到情感分类中,以改善旧词新义对情感分类准确度的影响,并由此提出通过旧词新义改善情感分类的NMOW‑AC算法。
-
公开(公告)号:CN113010525A
公开(公告)日:2021-06-22
申请号:CN202110354512.8
申请日:2021-04-01
Applicant: 东北大学
IPC: G06F16/22 , G06F16/215 , G06F16/2455 , G06F16/27 , G06K9/62 , G06N3/04
Abstract: 本发明提供一种基于PID的海洋时空大数据并行KNN查询处理方法,涉及时空大数据管理技术领域。该方法首次引入工业界广泛使用的PID控制器技术,实现了基于反馈机制的变步长查找处理。首先对获取到的海洋数据进行预处理,并采用网格划分方法实现对数据的划分,在此基础上,采用网格索引技术来索引预处理后的海洋数据;采用行排序方式对每个网格单元进行编码;通过使用行排序网格索引,判断出哪些行和列是在圆的半径范围内,从而直接判断是否和圆有交集;在进行KNN查询时,利用PID系统具有的可调节性,通过负反馈动态调整搜索的范围,实现KNN查询处理中查询半径的动态预测,减少了KNN查询次数,从而加快了KNN查询处理速度。
-
公开(公告)号:CN112182152A
公开(公告)日:2021-01-05
申请号:CN202011013190.2
申请日:2020-09-24
Applicant: 东北大学
IPC: G06F16/33 , G06F16/35 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明提供提出了基于深度学习的新浪微博用户情感影响力分析方法,包括数据获取、数据预处理、构建多元情感特征词向量、文本进行情感分类和定义微博用户情感影响力,本发明中通过使用MSF‑CNN算法对微博文本进行情感分析能力高于w2c‑CNN算法,能很好的配合微博中书写自由、用词随意的语言环境,能很好的考虑微博文本的上下语境,提取出文本特征,同时考虑词语自身所携带的情感,能更好的进行情感分类。
-
公开(公告)号:CN112181617A
公开(公告)日:2021-01-05
申请号:CN202010979603.6
申请日:2020-09-17
Applicant: 东北大学
Abstract: 本发明公开了一种基于特定索引结构的高效调度算法,由一个特殊的布隆过滤器和每个过滤器元素对应的事务队列组成,所述布隆过滤器和事务队列组成特殊的索引结构,其分别进行高效的依赖检测和保留必要的依赖信息,通过布隆过滤器,在一定时间内检测出事务之间的依赖关系,事务队列具有保持总顺序关系和简化依赖关系图的特性,借助于索引结构,调度器支持记录粒度锁,从而支持并发事务调度操作。本发明提出的方法高效的解决了依赖图调度中由于基于两两比较而调度开销过大导致的性能损失问题,保证了在各种依赖率工作负载下的并行执行能力,正式证明了副本调度与其他调度安全的一致性,调度器比对比方法具有更高的效率、可扩展性和健壮性。
-
公开(公告)号:CN106909639B
公开(公告)日:2020-09-29
申请号:CN201710083816.9
申请日:2017-02-16
Applicant: 东北大学
IPC: G06F16/22 , G06F16/2457 , G06F16/9537
Abstract: 本发明公开了一种基于Spark的链式多路空间连接查询处理算法,包括如下步骤:步骤1:将整个数据空间划分成许多大小相同的网格单元,并采用Z‑order填充曲线技术对每个网格单元进行编码;步骤2:将m路空间连接数据集中的每个空间对象根据其在数据空间中的位置投影到相应的网格单元;步骤3:如果满足条件i
-
公开(公告)号:CN107103055B
公开(公告)日:2020-05-12
申请号:CN201710237896.9
申请日:2017-03-29
Applicant: 东北大学
Abstract: 本发明公开一种面向内存更新密集型程序的Hourglass和Piggyback算法,其优秀性能来源于在updater和dumper线程之间的指针交换技术,可以避免大量数据拷贝。它周期性的发生updater和dumper线程的角色交换,可以被周期性无止境的复用,一旦上面的部分为空的时候交换上下角色。可以拥有更少的内存和基本没有抖动的延时效果。其都属于轻量级检查点算法的一种,Hourglass结合了目前最好的两个算法zigzag和pingpong,从而利用两个的优点指针交换和比特位标志。Piggyback算法提高性能通过提供一种全量快照,从而可以支持实时olap和oltp的应用。其具有更小的内存占用、全量快照开销、更小的延时、更均匀的延时的优点。
-
-
-
-
-
-
-
-
-