-
公开(公告)号:CN120030474A
公开(公告)日:2025-05-23
申请号:CN202510102253.8
申请日:2025-01-22
Applicant: 东北大学
IPC: G06F18/2433 , G06F18/22 , G06F18/2415 , G06F18/213 , G06F18/27 , G06F40/295 , G06F40/30 , G06N3/0464 , G06N3/045 , G06N3/084 , G06N3/0895
Abstract: 本申请提出一种基于自监督学习以及属性感知的广义实体匹配方法,自然语言处理技术领域,包括:通过自监督学习方法,采用伪标签生成策略,得到实体匹配的正负训练样本;采用共享权重机制来改善实体的嵌入学习过程,即属性类型嵌入与属性类型对应的属性值嵌入进行级联,使得属性值共享学习到的属性类型注意力权重得分,用得到的属性类型嵌入与属性值嵌入通过级联方式进行信息聚合,进一步整合实体整体特征信息来相互补充,提高实体对齐准确度。
-
公开(公告)号:CN113420215B
公开(公告)日:2023-08-29
申请号:CN202110698835.9
申请日:2021-06-23
Applicant: 东北大学
IPC: G06F16/9535 , G06F16/9536 , G06Q50/00
Abstract: 本发明提供一种面向兴趣点推荐的可解释生成方法,涉及社交网络以及兴趣点推荐技术领域。首先根据兴趣点推荐模型获取用户ID及推荐的兴趣点,以及兴趣点对应的影响因素;再根据兴趣点影响因素之间的标量投影,进行兴趣点影响因素之间的融合;将多个融合后的影响因素与推荐的兴趣点将多个融合后的影响因素与推荐的兴趣点进行相似性学习,得到融合后的影响因素与推荐的兴趣点间的相似性权重;根据相似性权重值,确定影响兴趣点推荐的主要影响因素;最后采用设定好的句子模板,基于主要影响因素对推荐的兴趣点进行句子解释;该方法对推荐的兴趣点的不同影响因素进行分析,在既保证推荐模型的准确率的同时,又保证了解释的合理性。
-
公开(公告)号:CN116361329A
公开(公告)日:2023-06-30
申请号:CN202310344062.3
申请日:2023-03-31
Applicant: 东北大学 , 北京奥星贝斯科技有限公司
IPC: G06F16/2453
Abstract: 本说明书实施例提供一种针对检索数据量进行估计的方法及装置,针对一个具体的数据查询请求,不仅考虑查询请求中的查询特征,还根据查询请求确定性相关数据表中的数据表信息,并从中提取数据特征。从而,可以同时考虑数据特征和查询特征,以进行数据量估计。这种方式由于在查询驱动Query‑Driven架构下引入数据表中的数据信息作为补充,从而可以加强查询编码能力,提高数据量估计的准确度。
-
公开(公告)号:CN116303675A
公开(公告)日:2023-06-23
申请号:CN202310272619.7
申请日:2023-03-20
Applicant: 东北大学
IPC: G06F16/2458 , G06F16/22 , G06F16/21 , G06F16/23 , G06F21/62
Abstract: 本发明设计一种基于共识组划分和多层索引的联盟链数据查询方法;针对联盟链系统中索引性能不佳以及多节点情况下扩展性差问题,开展面向联盟链查询设计研究以提高查询性能和安全性;对fabric系统做改进,提出节点共识组模型;共识组中存在主从节点且有多层,节点能在组内达成共识之后递归重复共识过程最终达成多层PBFT共识协议;提出双层跳跃列表索引模型,上层用于查找包含查询状态的底层的搜索范围;底层用于索引和查询区块链状态;通过新生成的区块版本号计算出在双层跳表顶层及底层的位置从而构建索引;通过版本号计算出顶层索引位置,计算出底层跳表所在层并展开搜索得到目标数据条目节点,通过条目节点从而查询目标区块数据并验证返回给客户端。
-
公开(公告)号:CN112199334A
公开(公告)日:2021-01-08
申请号:CN202011146473.4
申请日:2020-10-23
Applicant: 东北大学
IPC: G06F16/13 , G06F16/172 , G06F16/182 , G06F9/54
Abstract: 本发明提供了一种基于消息队列的数据流处理检查点文件存储的方法及装置,其中该方法根据流式计算中产生的用于保存中间状态的检查点文件进行特征分析,将其存储结构与消息队列消息队列的存储模型进行逻辑适配,设计文件操作接口与消息操作接口的映射关系,使用Zookeeper保存映射关系元信息部分;自定义分布式文件系统协议,提供依赖库的无服务形式被上游流式处理应用所依赖,以一种对用户透明的运行方式,根据实现的映射规则将检查点数据路由到对应的消息队列存储结构中,当流式应用重启时,根据Zookeeper中的元信息获取到消息队列中相应的状态数据,进行任务恢复以实现数据流计算框架容错机制。
-
公开(公告)号:CN110968792A
公开(公告)日:2020-04-07
申请号:CN201911028804.1
申请日:2019-10-28
Applicant: 东北大学
IPC: G06F16/9536 , G06Q50/00
Abstract: 本发明的基于节点嵌入和个性化时间间隔的复杂网络链路预测方法,包括:根据某领域数据集,捕获用户间的多种网络关系,生成时序多关系网络;确定时序多关系网络中要预测的目标类型链接,得到目标网络与辅助网络进行两个网络对应邻接矩阵的完备化处理,利用共享矩阵分解生成节点特征向量;针对不同类型的链接,动态生成个性化时间间隔和包含时间信息的关系形成序列,生成多关系网络中不同关系的影响力;以节点嵌入的乘积作为基础概率,利用霍克斯过程对关系形成序列进行建模,得到节点间链接形成的概率。本发明考虑用户在目标网络与辅助网络上的结构信息;在生成关系形成序列时利用个性化时间间隔解决了信息分布不均匀的问题,提高了预测的准确度。
-
公开(公告)号:CN107169033B
公开(公告)日:2020-03-31
申请号:CN201710249567.6
申请日:2017-04-17
IPC: G06F16/2453 , G06F16/28
Abstract: 本发明提供一种基于数据模式转换和并行框架的关系数据查询优化方法,涉及计算机数据库技术领域。该方法通过对关系模型数据上复杂查询语句进行结构分析,构建新的数据存储结构,实现在数据存储上的转换处理,将关系模型数据库中存储的数据转存到新的数据模式存储系统中,针对数据模式的变化进行相应查询语句的转换,基于SPARK SQL查询生成SPARK任务并执行该任务。本发明提供的关系数据查询优化方法能够将关系数据库中的数据针对查询的特征准确地转换到SPARK并行查询处理框架之上,从而有效提高对关系数据库上部分频繁执行的复杂查询的处理效率。
-
公开(公告)号:CN106909679A
公开(公告)日:2017-06-30
申请号:CN201710122912.X
申请日:2017-03-03
Applicant: 东北大学
IPC: G06F17/30
Abstract: 本发明是一种基于多路分块的渐近式实体识别方法,该方法为:多路分块生成相交的块,通过构建分块图消除块冗余,初始化块信用度和候选对信用度,将候选对按照信用度排序,并依次插入到候选队列;接着,迭代地进行以下三个步骤,(1)处理候选队列的候选对,(2)根据识别结果来更新一部分候选对的信用度,(3)根据更新的候选对的信用度来调整候选队列的顺序,并逐渐输出识别出的重复的数据对象对,不断重复这三步直到候选队列为空。采用本发明的渐近式实体识别方法,给定较短时间预算,可以识别出更多的重复的数据对象;通过动态地估计块的冗余度来更新候选对的信用度,实时地选择最可能匹配的候选对来进行识别,保证了高渐近性。
-
公开(公告)号:CN119886664A
公开(公告)日:2025-04-25
申请号:CN202411935499.5
申请日:2024-12-26
Applicant: 东北大学
IPC: G06Q10/0631 , G06Q10/101 , G06F18/213 , G06F18/22 , G06F40/284 , G06F40/30
Abstract: 本发明属于团队组建技术领域,公开一种结合全局内聚和局部解耦的任务关联诱导团队组建方法。提出一种基于异构协作网络的团队划分,更精细地描述专家之间的合作,能够同时捕捉文本中的隐含语义和专家之间的显性结构关系,以满足特定任务需求。利用超图和带权折叠图,从全局角度捕捉跨团队合作的潜力,并将这些全局表示通过局部解耦映射到团队内部专家表示中。这种方法不仅充分利用了团队内部结构,还有效避免了范围限制问题。本发明引入了任务相关性驱动的团队匹配策略。通过分析新任务与历史任务之间的相关性,该策略能够选择合适的候选团队,从而有效避免匹配过程中的伪失败现象。该策略旨在提高团队匹配的准确性和效率。
-
公开(公告)号:CN118297187A
公开(公告)日:2024-07-05
申请号:CN202410534801.X
申请日:2024-04-30
Applicant: 东北大学
IPC: G06N20/00 , G06F18/214 , G06F18/22 , G06F17/16 , G06N3/04
Abstract: 本发明公开了一种面向异质数据的梯度聚合联邦学习方法,包括:步骤S1,各Client端使用本地私有数据集训练同构神经网络vgg8,计算共享参数梯度,将共享参数梯度上传至对应的边缘节点;步骤S2,挑选满足梯度要求的每个边缘节点,参与Server端的聚合;步骤S3,Server端采用小样本种子数据集训练历史共享参数梯度;步骤S4,Server端接收来自Client端边缘节点的共享参数梯度,通过vgg8进行新一轮的共享参数梯度训练;步骤S5,当Server端与Client端进行第t轮交互时,Server端训练1个批次的样本;步骤S6,每个样本均会对同一个共享参数求解出一个梯度;步骤S7,通过分析Server端与Client端共享参数梯度之间的空间分布关系,得到参考优化方向尽量一致的梯度。实现Server端与Client端之间梯度的高效聚合。
-
-
-
-
-
-
-
-
-