-
公开(公告)号:CN112199943B
公开(公告)日:2023-10-03
申请号:CN202011013194.0
申请日:2020-09-24
Applicant: 东北大学
IPC: G06F40/216 , G06F40/242 , G06F40/289
Abstract: 本发明提供了一种基于最大凝聚系数和边界熵的未登录词识别方法,其特征在于:包括以下步骤:预处理—参数计算—判断未登录词—未登录词保存至文件—未登录词添加;本发明中实验表明,本发明中所提出的算法准确率为66.67%相比于汪龙庆等在计算机应用与软件期刊中所发表的论文:基于未登录词识别的微博评价短语抽取方法中所提出的算法准确率为60.05%有较大程度的提高,提升了6.62个百分点,并且分别在未登录词识别的精确率、召回率和F1值也有所改善,推测结果提高的原因是左右邻接边界熵这两个参数对未登录词识别都有影响,但汪龙庆等的论文中中将左右邻接边界熵最小值设为一个参数,只是取其中最小值为影响未登录词识别算法的因素。
-
公开(公告)号:CN108804415B
公开(公告)日:2022-01-11
申请号:CN201810477586.9
申请日:2018-05-18
Applicant: 东北大学
IPC: G06F40/30 , G06F40/253 , G06K9/62
Abstract: 本发明公开了一种本体调试信息的度量与排序方法,包括根据用户对辩解的认知,提取辩解的度量标准,所述度量标准包含复杂度、相关度及新颖度三方面;采用ListNet排序学习方法构造top k排序模型,根据该排序模型对特征化后的辩解进行排序,获取排序前k个易理解的辩解。从用户认知的角度提出一套度量OWL辩解的标准,该套标准综合考虑了复杂度、相关度和新颖度三方面,基于该套标准,构造一个top k排序模型,获取易理解的前k个辩解,帮助用户更好地进行本体不一致的解释工作,从而增强用户体验。
-
公开(公告)号:CN108133330A
公开(公告)日:2018-06-08
申请号:CN201810032010.1
申请日:2018-01-12
Applicant: 东北大学
Abstract: 本发明公开了一种面向社交众包任务分配方法及其系统,包括根据任务发布者发布的众包任务,对工作者以及所述众包任务进行匹配度估计算法计算,得到众包任务匹配度最高的一组工作者;采用贪心算法对任务分配进行计算,在众包任务匹配度最高的一组工作者中,选择整体匹配度之和最大的一组工作者作为最后的分配结果,以使得每个任务具有不同的待分配工作者,等待工作者成员领取任务,完成众包任务分配,增加了任务推荐的兴趣等信息的参考关系,使得任务推荐更加的高效,准确,并且,提高了算法性能,提高众包服务的质量。
-
公开(公告)号:CN109901932B
公开(公告)日:2023-04-07
申请号:CN201910185650.0
申请日:2019-03-12
Applicant: 东北大学
Abstract: 本发明公开了一种基于虚拟机的服务器整合方法,所述基于虚拟机的服务器整合方法包括基于动态阈值的服务器局部整合算法和基于遗传算法的服务器全局整合算法。本发明科学合理,使用安全方便,通过局部整合和全局整合,可以有效地实现依据云数据中心负载变化动态来进行服务器整合的重要功能,从而提升业务支撑能力和运维效率、降低投资和决策风险,达到节省投资和节约能源的目的。提出的服务器局部整合算法的目标是对处于高载状态和低载状态的服务器进行小范围内的局部整合,满足节能要求;服务器全局整合算法的目标是在更大范围内对服务器进行整合,在保证服务质量的同时使虚拟机运行在尽可能少的服务器上,从而提升整体资源利用率和降低能源消耗。
-
公开(公告)号:CN109947904B
公开(公告)日:2021-07-30
申请号:CN201910222188.7
申请日:2019-03-22
Applicant: 东北大学
Abstract: 本发明公开了一种基于Spark环境的偏好空间Skyline查询处理方法,包括基于偏好函数的空间Skyline查询处理算法和基于偏好优先的空间Skyline查询处理算法,本发明科学合理,使用安全方便,通过基于偏好函数的空间Skyline查询处理算法的作用,将数据的空间属性与非空间属性相整合,并利用相关性对不满足任一查询点偏好的数据进行过滤,减少了数据集的大小,利用网格支配关系进一步减少处理任务量,提高了查询的处理速度;通过基于偏好优先的空间Skyline查询处理算法的作用,对空间数据进行聚类,并将类中出现频率较高的关键词作为整个类的文本特征信息,同时对类中的空间对象建立扩展的R‑tree索引,利用扩展R‑tree索引的高效空间查找和过滤能力进行支配判断,从而加快Skyline查询处理。
-
公开(公告)号:CN108804415A
公开(公告)日:2018-11-13
申请号:CN201810477586.9
申请日:2018-05-18
Applicant: 东北大学
CPC classification number: G06F17/2785 , G06F17/274 , G06K9/6277
Abstract: 本发明公开了一种本体调试信息的度量与排序方法,包括根据用户对辩解的认知,提取辩解的度量标准,所述度量标准包含复杂度、相关度及新颖度三方面;采用ListNet排序学习方法构造top k排序模型,根据该排序模型对特征化后的辩解进行排序,获取排序前k个易理解的辩解。从用户认知的角度提出一套度量OWL辩解的标准,该套标准综合考虑了复杂度、相关度和新颖度三方面,基于该套标准,构造一个top k排序模型,获取易理解的前k个辩解,帮助用户更好地进行本体不一致的解释工作,从而增强用户体验。
-
公开(公告)号:CN102043852B
公开(公告)日:2012-07-18
申请号:CN201010600979.8
申请日:2010-12-22
Applicant: 东北大学
IPC: G06F17/30
Abstract: 一种基于路径信息的可扩展标记语言祖先后代索引方法,包括以下步骤:步骤一:解析XML文档;步骤二:建立B+树索引;步骤三:使用B+树索引进行祖先后代关系查询。本发明是一个实用的索引,基于计算机数据库领域内的B+树结构,该结构保证了在绝大多数情况下,采用索引都会比不采用索引查询效率有很大的提高,该索引无论对于基于关系数据库的XML数据库管理系统还是基于Native存储的XML数据库管理系统,都易于实现;该结构实现简单,只需要进行一次节点扫描,对于文档的数据是否有数据倾斜状况,都有很好的性能;还可以很好的处理A1//A2//…//An这类复杂的路径查询,避免了把长路径分成若干个祖先后代对的做法,有效的实现了对索引节点一次扫描即可得到查询结果。
-
公开(公告)号:CN116804987A
公开(公告)日:2023-09-26
申请号:CN202310697283.9
申请日:2023-06-13
Applicant: 东北大学
IPC: G06F16/22 , G06F16/2455 , G06F16/23
Abstract: 本发明公开了一种大负载场景下数据加速方法、系统、及存储介质,包括:建立树模型,所述比较树模型包括用于比较的树,所述树中设置有全局标志位,非叶子节点设置标志位。将待处理数据依次插入树的每个空叶子节点,将父节点作为比较场地进行两两比较,大的数据留在比较场地节点,较小的数据继续向父节点方向参与比较,比较后从根节点输出最小的数据到树外,将最小的数据所在的叶子节点清空,并根据输出数据的标志位,对树的全局标志位进行更新;下一个待处理数据传入树中唯一的空叶子节点。通过标志位锦标赛排序,仅在开始排序时进入一次初始插入阶段和评估阶段,在待排序数据耗尽时进入一次阶段,使得算法不会因频繁地阶段切换而造成性能下降。
-
公开(公告)号:CN108537782B
公开(公告)日:2021-08-31
申请号:CN201810280577.0
申请日:2018-04-02
Applicant: 东北大学
Abstract: 本发明公开了一种基于轮廓提取的建筑物图像匹配与融合的方法,包括:对历史照片进行预处理;对预览照片和预处理后的历史照片进行轮廓提取,得到历史照片和预览照片的轮廓图;对两个照片的轮廓图进行直线提取,并使用直线匹配算法,按照直线特征对历史照片和预览照片的直线进行配对,得到最优匹配队集合;对最优匹配队集合内直线间夹角进行计算,得到两个夹角矩阵,并对夹角矩阵进行相似度计算,得到历史照片和预览照片的相似度;对预览照片与历史照片进行图像融合处理,使得相似照片与历史照片同时显示在一张照片中,能够将历史建筑与现有的预览照片进行实时的匹配,判断两个建筑物图像的匹配程度,使得建筑照片的比对更加准确和快速。
-
公开(公告)号:CN112199943A
公开(公告)日:2021-01-08
申请号:CN202011013194.0
申请日:2020-09-24
Applicant: 东北大学
IPC: G06F40/216 , G06F40/242 , G06F40/289
Abstract: 本发明提供了一种基于最大凝聚系数和边界熵的未登录词识别方法,其特征在于:包括以下步骤:预处理—参数计算—判断未登录词—未登录词保存至文件—未登录词添加;本发明中实验表明,本发明中所提出的算法准确率为66.67%相比于汪龙庆等在计算机应用与软件期刊中所发表的论文:基于未登录词识别的微博评价短语抽取方法中所提出的算法准确率为60.05%有较大程度的提高,提升了6.62个百分点,并且分别在未登录词识别的精确率、召回率和F1值也有所改善,推测结果提高的原因是左右邻接边界熵这两个参数对未登录词识别都有影响,但汪龙庆等的论文中中将左右邻接边界熵最小值设为一个参数,只是取其中最小值为影响未登录词识别算法的因素。
-
-
-
-
-
-
-
-
-