面向内存更新密集型程序的Hourglass方法

    公开(公告)号:CN107103055B

    公开(公告)日:2020-05-12

    申请号:CN201710237896.9

    申请日:2017-03-29

    Applicant: 东北大学

    Abstract: 本发明公开一种面向内存更新密集型程序的Hourglass和Piggyback算法,其优秀性能来源于在updater和dumper线程之间的指针交换技术,可以避免大量数据拷贝。它周期性的发生updater和dumper线程的角色交换,可以被周期性无止境的复用,一旦上面的部分为空的时候交换上下角色。可以拥有更少的内存和基本没有抖动的延时效果。其都属于轻量级检查点算法的一种,Hourglass结合了目前最好的两个算法zigzag和pingpong,从而利用两个的优点指针交换和比特位标志。Piggyback算法提高性能通过提供一种全量快照,从而可以支持实时olap和oltp的应用。其具有更小的内存占用、全量快照开销、更小的延时、更均匀的延时的优点。

    基于图卷积网络的社交网络文本情感细粒度分类方法

    公开(公告)号:CN110472003A

    公开(公告)日:2019-11-19

    申请号:CN201910728633.7

    申请日:2019-08-08

    Applicant: 东北大学

    Abstract: 本发明提供一种基于图卷积网络的社交网络文本情感细粒度分类方法,涉及自然语言处理(NLP)中检测文本作者情感极性的领域。本发明对于社交网络文本上的愤怒、厌恶、恐惧、快乐、喜欢、悲伤和惊讶等情绪进行分类,建立了一种基于语法的细粒度情感检测图形卷积网络(GCN)模型。该模型采用BI-LSTM网络对给定文本进行初步特征提取,将句子图的初步特征和邻接矩阵输入到一个单层GCN中,以利用句子的句法结构,最后得到池化层或全连接层的概率分布。用BI-LSTM网络与GCN相结合,增强了模型对汉语文本不同语法结构的理解,提高了模型的鲁棒性,提出的基于百分位数的池化方法提高了模型的精确度。

    一种基于Spark环境的偏好空间Skyline查询处理方法

    公开(公告)号:CN109947904A

    公开(公告)日:2019-06-28

    申请号:CN201910222188.7

    申请日:2019-03-22

    Applicant: 东北大学

    Abstract: 本发明公开了一种基于Spark环境的偏好空间Skyline查询处理方法,包括基于偏好函数的空间Skyline查询处理算法和基于偏好优先的空间Skyline查询处理算法,本发明科学合理,使用安全方便,通过基于偏好函数的空间Skyline查询处理算法的作用,将数据的空间属性与非空间属性相整合,并利用相关性对不满足任一查询点偏好的数据进行过滤,减少了数据集的大小,利用网格支配关系进一步减少处理任务量,提高了查询的处理速度;通过基于偏好优先的空间Skyline查询处理算法的作用,对空间数据进行聚类,并将类中出现频率较高的关键词作为整个类的文本特征信息,同时对类中的空间对象建立扩展的R-tree索引,利用扩展R-tree索引的高效空间查找和过滤能力进行支配判断,从而加快Skyline查询处理。

    一种面向多模态的幽默识别方法
    45.
    发明公开

    公开(公告)号:CN119863742A

    公开(公告)日:2025-04-22

    申请号:CN202510021534.0

    申请日:2025-01-07

    Applicant: 东北大学

    Abstract: 本发明提供了一种面向多模态的幽默识别方法,涉及多模态幽默识别技术领域,在一种实现方式中,本发明将引入的外部知识作为单独模态,并与文本、音频和视频模态进行融合。先通过全连接层进行维度对齐,再将其拼接输入到Transformer中学习四种模态之间的交互关系,同时借助交叉注意力机制对模态融合进行了优化,由此解决了外部知识引入和模态融合方案的问题。在另一种实现方式中,通过图注意力网络进行数据增强,来弥补当前数据集数量稀缺的问题,将相关模态进行融合拼接,然后送入到交叉注意力网络中,再通过多头自注意力层进一步融合,最后输入到最大池层获得融合向量的单一特征表示,得到幽默极性的预测概率分布,由此得到更加有效的模态融合。

    基于改进BL算法和遗传算法的Spark批量应用调度方法

    公开(公告)号:CN117909048A

    公开(公告)日:2024-04-19

    申请号:CN202410080510.8

    申请日:2024-01-19

    Applicant: 东北大学

    Abstract: 本发明提供基于改进BL算法和遗传算法的Spark批量应用调度方法,涉及互联网技术应用调度技术领域。该方法具体包括:利用Spark集群上已执行批量应用的应用运行指标构建应用执行时间预测模型,预测待执行批量应用的预测执行时间;对待执行批量应用进行编码,随机生成待执行批量应用的应用执行顺序并构建初始种群作为当前种群开始迭代:利用改进的BL算法计算待执行批量应用的总执行时间;再采用遗传算法对当前种群进行选择、交叉和变异,生成下一代种群作为当前种群并完成一次迭代;当迭代停止后,从所有迭代结果中选择与待执行批量应用中总执行时间最短的应用执行顺序作为待执行批量应用的调度顺序,有效地减少了批量应用的调度时间和等待时间。

    一种大负载场景下数据加速方法、系统、及存储介质

    公开(公告)号:CN116804987A

    公开(公告)日:2023-09-26

    申请号:CN202310697283.9

    申请日:2023-06-13

    Applicant: 东北大学

    Abstract: 本发明公开了一种大负载场景下数据加速方法、系统、及存储介质,包括:建立树模型,所述比较树模型包括用于比较的树,所述树中设置有全局标志位,非叶子节点设置标志位。将待处理数据依次插入树的每个空叶子节点,将父节点作为比较场地进行两两比较,大的数据留在比较场地节点,较小的数据继续向父节点方向参与比较,比较后从根节点输出最小的数据到树外,将最小的数据所在的叶子节点清空,并根据输出数据的标志位,对树的全局标志位进行更新;下一个待处理数据传入树中唯一的空叶子节点。通过标志位锦标赛排序,仅在开始排序时进入一次初始插入阶段和评估阶段,在待排序数据耗尽时进入一次阶段,使得算法不会因频繁地阶段切换而造成性能下降。

    基于深度学习的音乐多模态数据情感识别方法

    公开(公告)号:CN115064181A

    公开(公告)日:2022-09-16

    申请号:CN202210654145.8

    申请日:2022-06-10

    Applicant: 东北大学

    Abstract: 本发明涉及音乐多模态数据情感识别技术领域,尤其涉及基于深度学习的音乐多模态数据情感识别方法。其主要针对现有音乐学习单一模态识别情感提升的空间有限,不能深度挖掘音乐数据集中的特征向量的问题,提出如下技术方案:S1:音乐数据的预处理;S2:MIDI数据的特征提取;S3:文本数据的特征提取;S4:多模态融合。本发明利用决策级融合的思路进行多模态融合能够比特征级融合取得更好的情感分类效果,对音乐文本的情感深度学习,促进深度学习在音乐情感识别中的应用,提高音乐的分析效果,减少人工情感标注的作业量,提高准确率,主要应用于基于深度学习的音乐多模态数据情感识别。

    改进Transformer的情感增强对话生成方法

    公开(公告)号:CN115048943A

    公开(公告)日:2022-09-13

    申请号:CN202210652231.5

    申请日:2022-06-10

    Applicant: 东北大学

    Abstract: 本发明涉及人机对话技术领域,尤其涉及改进Transformer的情感增强对话生成方法。其主要针对现有人机对话情感标注质量不高,机器不能准确的感知用户的情感并且不能生成有情感的回复的问题,提出如下技术方案:包括在Transformer基础上对Transformer编码的自注意力层的改进,所述改进在于在Transformer的原自注意力层增加情感注意力模块,生成TEECG模型,所述TEECG模型包括Encoder层和Decoder层。本发明对原有的Transformer编码的自注意力层改进,具备对对话语句之间的语义和情感的捕捉,使得人机对话更具情感,解码器对对话中情感回复进行修正,生成的情感回复效果更好,主要应用于人机对话中语句情感的改进。

    对长文本友好的知识图谱表示学习方法

    公开(公告)号:CN113761224A

    公开(公告)日:2021-12-07

    申请号:CN202111020769.6

    申请日:2021-09-01

    Applicant: 东北大学

    Abstract: 本发明公开了对长文本友好的知识图谱表示学习方法,包括如下步骤:步骤一:长文本友好的文本信息抽取;步骤二:BCRL的文本表示模型;骤三:基于TransE的结构化表示;步骤四:结构‑文本联合标识;步骤五:模型训练。本发明提出了一种文本增强的知识图表示模型BCRL,该模型利用实体描述和关系提及来增强三元组的知识表示,该方法从文本‑句子的角度出发,解决了实体描述的不统一、关系提及表示的不准确等问题,能够更有效地捕获文本的语义信息,并且在链路预测任务方面与基准系统相比有显著的改进。

Patent Agency Ranking