-
公开(公告)号:CN112083956A
公开(公告)日:2020-12-15
申请号:CN202010971038.9
申请日:2020-09-15
Applicant: 哈尔滨工业大学
Abstract: 一种面向异构平台的复杂指针数据结构自动管理系统,涉及异构编程技术领域。本发明为了实现OpenMP Offloading程序中复杂指针数据结构在异构计算平台上的自动管理并保证数据一致性。本发明包括:信息收集模块,用于对源程序的静态分析及程序信息收集;自动转换模块,主要负责根据变量类型的不同,在适当位置修改源码并插入合适的运行时API;运行时模块,主要负责使用cudaMallocManaged( )和cudaFree( )重新实现C++标准的内存管理操作并向外提供接口。本发明可以自动管理OpenMP Offloading程序中复杂指针数据结构在CPU和GPU内存之间的内存分配、释放以及数据传输,并保证数据一致性;从而为OpenMP Offloading程序开发提供便利。
-
公开(公告)号:CN112054805A
公开(公告)日:2020-12-08
申请号:CN202010961326.6
申请日:2020-09-14
Applicant: 哈尔滨工业大学(深圳)
IPC: H03M7/30
Abstract: 本发明实施例提供了一种模型数据压缩方法、系统及相关设备,用于节约网络传输资源,提高模型数据压缩率。本发明实施例方法包括:计算目标模型与参考模型中的同种类型参数之间的差量数据;采用预设压缩算法对所述差量数据进行压缩得到目标压缩文件;将所述目标压缩文件发送给目标终端设备,以使得所述目标终端设备根据所述差量数据以及本地存储的所述参考模型恢复所述目标模型。
-
公开(公告)号:CN111966397A
公开(公告)日:2020-11-20
申请号:CN202010710022.2
申请日:2020-07-22
Applicant: 哈尔滨工业大学
Abstract: 一种异构并行程序自动移植和优化方法,属于异构并行程序开发技术。本发明是为了实现CPU并行程序自动移植、在减轻开发人员工作负担的同时提高程序性能,从而解决并行指令转换、数据传输管理及优化问题。技术要点:构建异构并行程序自动移植系统的框架,异构并行程序自动移植系统用于将OpenMP CPU并行程序自动翻译为OpenMP Offloading异构并行程序;一致性状态转换形式化,保证数据一致性的前提下,优化传输操作,减少冗余数据传输;运行时库设计,运行时库用于提供自动数据传输管理和优化功能,维护每个变量内存区域一致性状态;源到源翻译器设计,翻译器用于自动转换并行指令及自动插入运行时API。该方法可以自动识别CPU并行指令并转换为加速器并行指令,提高程序性能。
-
公开(公告)号:CN111797985A
公开(公告)日:2020-10-20
申请号:CN202010710031.1
申请日:2020-07-22
Applicant: 哈尔滨工业大学
Abstract: 一种基于GPU的卷积运算内存访问优化方法,涉及卷积运算访存优化技术。本发明能够解决现有技术的卷积运算访存开销较大的缺陷。技术要点:将卷积核数据加载至共享内存中;将卷积输出以32列为单位分割成子块,得到若干个包含32列数据的子块以及1个少于32列数据的子块;每个线程计算该线程所需要的第一个数据的索引;每个线程通过列重用算法从所述第一个数据的索引中获取剩余所需的输入数据,并将获取的输入数据传递给行重用算法;经过行重用算法计算输出结果并存储在寄存器数据sum中;并将sum写入全局内存;计算卷积输出中其余待计算的数据。本发明用于对图像处理、视频处理和机器学习领域中的卷积运算进行访存优化。
-
公开(公告)号:CN107360031B
公开(公告)日:2020-04-14
申请号:CN201710587014.1
申请日:2017-07-18
Applicant: 哈尔滨工业大学
Abstract: 一种基于优化开销收益比的虚拟网络映射方法,本发明涉及虚拟网络映射方法。本发明为了解决现有技术不能在有限的物理资源内保证高的映射成功率,以及现有技术大多是从单个虚拟节点到单个物理节点的映射的问题。本发明是在现有的虚拟网络映射问题中扩大虚拟网络的规模,使其大于底层物理网络的规模,也就是虚拟网络的节点规模数大于物理网络的节点规模。本发明主要目的是在映射所有的虚拟网络请求的情况下,尽可能的减少底层物理资源的使用,提高本发明方法映射的成功率以及算法收益。比较传统Node‑Opt算法,本发明在映射收益上高出将近30%,在不同的虚拟网络请求规模下普遍将映射成功率提高了50%以上。本发明用于虚拟网络映射领域。
-
公开(公告)号:CN110399182A
公开(公告)日:2019-11-01
申请号:CN201910680644.2
申请日:2019-07-25
Applicant: 哈尔滨工业大学
Abstract: 一种CUDA线程放置优化方法,涉及基于机器学习的线程优化技术。本发明的目的是提供一种CUDA线程放置优化方法,以实现降低编程人员工作难度以及减少训练数据的获取时间的目的。技术要点:程序信息采集、程序信息处理、机器学习模型训练,程序信息处理是对静态信息和程序运行时信息进行信息汇总、数值化处理、归一化处理得到训练集程序特征,并利用程序执行时间信息集设置标签从而完成标签数据的生成;将训练集程序特征和标签数据作为输入,利用支持向量机算法进行性能建模,得到程序性能预测模型;在线程优化放置应用时,首先需调用程序信息采集模块,采集待优化程序的程序信息,然后输入已训练好的程序性能预测模型,即可获得合适的线程块设置方案。
-
公开(公告)号:CN110391937A
公开(公告)日:2019-10-29
申请号:CN201910680597.1
申请日:2019-07-25
Applicant: 哈尔滨工业大学
Abstract: 一种基于SOAP服务模拟的物联网蜜网系统,属于物联网安全技术领域。本发明的目的是为了监测收集物联网的安全状态,并捕获黑客针对物联网的恶意请求,收集恶意样本。本发明根据一个路由器SOAP服务漏洞CVE-2017-17215设计了一种中高交互蜜罐;为了防止黑客利用模拟服务未完成的服务细节进行注入,导致模拟服务蜜罐无法响应从而不能捕获后续恶意代码和样本,使用带有漏洞的设备固件实现了提供真实SOAP服务的蜜罐补充模拟服务蜜罐的功能;为了对更多类型的SOAP攻击进行捕获,针对2018年暴露最多的SOAP端口进行分析并制作了相应的多端口蜜罐。通过将这些蜜罐部署到多个节点,同时设计控制中心进行命令的分发和文件的传输,辅以Docker技术封装实现快速部署。黑客无法通过SOAP服务漏洞来控制物联网设备,提高物联网的安全性。
-
公开(公告)号:CN110377525A
公开(公告)日:2019-10-25
申请号:CN201910680598.6
申请日:2019-07-25
Applicant: 哈尔滨工业大学
IPC: G06F11/36
Abstract: 一种基于运行时特征和机器学习的并行程序性能预测系统,属于并行程序性能预测的技术领域。本发明为了解决基于机器学习的并行程序性能预测系统存在开销比较大、预测时间长,而且准确率较低的问题。对原始程序进行混合插桩,减少基本块计数器,然后将程序删减成没有输入结果的串行程序,减少程序的运行时间的同时保留程序执行的流程,准确快速地获取到基本块频率,预处理这些数据,输入预测模型中,最后输出大规模并行程序的执行时间。本发明生成的模型具有很强的泛化能力,能够准确地预测大规模并行程序的执行时间,并且预测开销很小。
-
公开(公告)号:CN110362411A
公开(公告)日:2019-10-22
申请号:CN201910680641.9
申请日:2019-07-25
Applicant: 哈尔滨工业大学
Abstract: 一种基于Xen系统的CPU资源调度方法,涉及CPU资源调度技术领域。本发明为了解决现有的CPU资源调度的方法无法对具体运行的任务进行区分、无法与实时运行环境进行结合来调整CPU资源等问题。将vcpu队列作为输入数据,对RNN分类模型进行训练;获取Xen系统的全局队列信息credit[]和pri[],再利用训练好的RNN分类模型对Xen系统的全局队列信息credit[]和pri[]进行分类;判断上述数组是否为空,如果是则结束,否则分类结果通过Q-learning算法来更新q-table表;利用当前更新后q-table表进行时间片调整来完成CPU资源的调度。提高资源的有效利用率并降低云数据中心的能源消耗。
-
公开(公告)号:CN109635951A
公开(公告)日:2019-04-16
申请号:CN201811547551.4
申请日:2018-12-18
Applicant: 哈尔滨工业大学
IPC: G06N7/00
CPC classification number: G06N7/00
Abstract: 基于加权分布对齐和几何特征对齐的无监督跨领域自适应数据标定方法及系统,涉及数据标定技术领域。本发明为了有效地提高数据标定准确率。加权分布对齐能够权衡样本数据的边际概率分布和条件概率分布的重要性,进而减小领域间的差异;几何特征对齐不但能进一步挖掘领域间样本数据的几何特征,而且通过图拉布拉斯正则化可以很好的保持样本数据空间的几何结构,进而提高样本可分性和数据标定的准确性。通过与其他方法进行实验对比,本发明开发的系统—基于加权分布对齐和几何特征对齐的无监督跨领域自适应数据标定方法可以有效地提高数据标定准确率。
-
-
-
-
-
-
-
-
-