一种申威架构上的虚拟机访存特征提取方法及系统

    公开(公告)号:CN110865869A

    公开(公告)日:2020-03-06

    申请号:CN201911070571.1

    申请日:2019-11-05

    Applicant: 北京大学

    Abstract: 本发明公开了一种申威架构上的虚拟机访存特征提取方法及系统,其通过“热页集”机制、“置位-中断”方法和“访存失效率曲线”构建方法,获取虚拟机访存序列的重用距离分布、内存缺页率、访内存缺页率曲线,得到虚拟机工作集大小。本发明在申威平台上首次实现了动态访存特征提取提取技术,成功地绘制高精度的内存缺失率曲线并计算出准确的工作集大小,为下一步根据工作集大小进行有效的多虚拟机内存动态调配以提高内存利用率提供基础条件。

    一种基于局部性表达函数优化MapReduce框架的运行效率的方法和装置

    公开(公告)号:CN108153585A

    公开(公告)日:2018-06-12

    申请号:CN201711249478.8

    申请日:2017-12-01

    Applicant: 北京大学

    CPC classification number: G06F9/4881

    Abstract: 本发明涉及一种基于局部性表达函数优化MapReduce框架的运行效率的方法和装置。该方法在Map阶段之前建立局部性表达函数,局部性表达函数通过实数值的大小关系表达局部性;在Map阶段根据计算出的局部性表达函数的值进行数据的加载,将不同数据按照局部性表达函数的数值区间分配给不同的计算节点来进行运算。在多轮MapReduce任务中,将局部性表达函数的值作为中间结果附带在Map和Reduce阶段,并在各个计算节点之间传递,以迭代计算局部性表达函数的值,在达到设定的收敛阈值之后,按照局部性表达函数的数值区间进行数据的重新分布。本发明的目的是通过局部性表达函数优化MapReduce框架的运行效率。

    一种基于推迟提交的GPU虚拟化优化方法

    公开(公告)号:CN103955394B

    公开(公告)日:2017-05-17

    申请号:CN201410133294.5

    申请日:2014-04-03

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于推迟提交的GPU虚拟化优化方法。本方法为:1)客户机上的GPU虚拟化框架前端读入一待执行CUDA应用程序的二进制文件,查找并标记可推迟提交的循环;2)前端执行到可推迟提交的循环部分时,直到该循环结束之前,缓存所有的CUDA函数调用信息及其依赖关系,跳过该函数调用的执行,然后在该循环结束之后将该缓存信息一次发送到宿主机上的GPU虚拟化框架后端;3)后端根据该缓存信息重新构建函数调用并执行,然后将所有任务执行结果打包一次发送回前端;可推迟提交的循环指不去执行循环中的CUDA函数调用,循环依然可以正确执行。本发明减少了前后端通信的次数,从而对GPU虚拟化的性能进行优化。

    一种虚拟机管理器的客户操作系统内核代码动态替换方法

    公开(公告)号:CN101539868B

    公开(公告)日:2010-12-08

    申请号:CN200910081513.9

    申请日:2009-04-10

    Applicant: 北京大学

    Abstract: 本发明公开了一种虚拟机管理器的客户操作系统内核代码动态替换方法,属于软件技术领域。本发明为:1)在宿主操作系统中加入一CID进程,并分配一植入空间以容纳植入的替换代码,然后VMM将植入空间映射到Guest OS的内核进程空间;2)VMM统计所需替换的代码片断;3)CID根据统计结果为其指定一段替换代码;4)将指定的替换代码写入植入空间,并获取其所处的调用堆栈;5)CID通过调用堆栈信息,找到所需替换代码在Guest OS中的调用点,VMM将调用点的跳转地址改为所指定的替换代码的偏移地址。本发明将半虚拟化方法的优势融入全虚拟化技术之中成为可能,可以在二进制层面对GuestOS内核代码做动态替换。

    一种分布式FORTRAN模块间的通信方法

    公开(公告)号:CN101788923A

    公开(公告)日:2010-07-28

    申请号:CN201010119458.0

    申请日:2010-03-05

    Applicant: 北京大学

    Abstract: 本发明公开了一种分布式FORTRAN模块间的通信方法,属于软件技术领域。本方法为:1)将分布在各主机上的FORTRAN模块依次进行C语言、Java语言封装,生成Web Service模块,其内包含一适配器;2)主机A的适配器生成发往主机B的全局变量文件A,主机A与主机B通过Web Service模块通信;3)主机B的适配器解析该文件A,并对参数赋值;4)主机B的适配器调用该FORTRAN模块执行运算,并利用该适配器生成全局变量文件B;5)主机B的适配器将生成的文件B发给主机A;6)主机A的适配器解析该文件B,并对参数赋值后传给该FORTRAN模块。本发明极大提高了FORTRAN遗留程序的可重用性。

    一种实时问答方法及系统
    46.
    发明授权

    公开(公告)号:CN113204976B

    公开(公告)日:2024-03-29

    申请号:CN202110419207.2

    申请日:2021-04-19

    Applicant: 北京大学

    Abstract: 本发明公开了一种实时问答方法及系统。本方法为:1)建立并训练一个多任务神经网络并训练;其中多任务神经网络包括文档编码器、问题编码器和排序器,文档编码器和问题编码器为共享同一套训练参数的预训练语言模型网络;2)用文档编码器离线预计算设定文档中各候选答案的上下文表示向量;3)用问题编码器在线编码当前问题的表示向量;4)计算该问题的表示向量与每一候选答案的上下文表示向量之间的相似度;5)找到相似度最高的候选答案在该设定文档中的位置边界信息;6)通过修改该位置边界信息,从该设定文档中确定出若干高质量候选答案;7)用排序器对各高质量候选答案进行排序,选择出排序在最前的高质量答案做为该问题的最终答案。

    一种虚拟机异构内存池化方法和系统

    公开(公告)号:CN115640098A

    公开(公告)日:2023-01-24

    申请号:CN202211197744.8

    申请日:2022-09-29

    Applicant: 北京大学

    Abstract: 本发明涉及一种虚拟机异构内存池化方法和系统。该方法包括:根据每个虚拟机的访存情况,利用桶排序与阈值法综合决策出每个虚拟机的热页集合;当虚拟机占用页面小于DRAM容量时,利用页面迁移技术将DRAM中的空闲页面迁移到NVM中,并将原空闲页面放入虚拟机异构内存池中;当虚拟机热页集合大于DRAM容量时,向虚拟机异构内存池请求空闲页面作为超额热页的页面迁移的目标;当虚拟机热页集合小于DRAM容量时,将从虚拟机异构内存池请求的页面归还对应数量回虚拟机异构内存池。本发明解决了传统多虚拟机内存调整气球技术无法在多内存节点调整的问题;不需要在虚拟机中需求额外的驱动程序,同时也减轻了内存调整复杂的调用栈,使多虚拟机内存调整更高效。

    一种基于PML的虚拟机页面迁移方法和系统

    公开(公告)号:CN115576644A

    公开(公告)日:2023-01-06

    申请号:CN202211197760.7

    申请日:2022-09-29

    Applicant: 北京大学

    Abstract: 本发明涉及一种基于PML的虚拟机页面迁移方法和系统。该方法包括:在迁移之前,根据迁移页面数量设定多线程迁移,同时利用反向映射机制,获取所有迁移页面对应的EPT页表项并清除其脏位;在迁移时首先对每个页面进行数据拷贝,然后解除旧页面映射以避免虚拟机停机;在虚拟机页面迁移的过程中,当被迁移的原页面又发生修改时,利用Intel PML技术高效的捕获被修改的脏页面,重新拷贝脏页数据;在新映射建立成功后,利用新的PFN重新填充该页面对应的EPT页表项。本发明所提出的方案充分利用Intel PML的高效追踪脏页的特性加速页面迁移对脏页的处理;同时页面迁移充分考虑虚拟化二维地址翻译特性,利用EPT重填避免额外的虚拟机退出开销。

    一种基于地址过滤的动态缓存失效率曲线生成方法

    公开(公告)号:CN113297102A

    公开(公告)日:2021-08-24

    申请号:CN202110510282.X

    申请日:2021-05-11

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于地址过滤的动态缓存失效率曲线生成方法。本方法的步骤包括:1)将访存序列数据集中的各访存序列划分到各缓存组上,然后计算每个缓存组上的缓存失效率曲线;2)计算每个缓存组上的缓存失效率曲线与每一访存序列的真实缓存失效率曲线之间的距离,得到N*S个距离;3)从缓存组的维度将该N*S个距离划分为S个样本并对其进行聚类处理,保留平均距离小于设定阈值的k类缓存组;4)从访存序列的维度将该N*S个距离划分为N个样本,将k类缓存组上的距离作为每个样本的特征并聚类处理,根据分类结果选取出若干个缓存组;5)在线采集所选取缓存组上的访存序列;6)基于所采集的访存序列计算缓存失效率曲线。

    一种实时问答方法及系统
    50.
    发明公开

    公开(公告)号:CN113204976A

    公开(公告)日:2021-08-03

    申请号:CN202110419207.2

    申请日:2021-04-19

    Applicant: 北京大学

    Abstract: 本发明公开了一种实时问答方法及系统。本方法为:1)建立并训练一个多任务神经网络并训练;其中多任务神经网络包括文档编码器、问题编码器和排序器,文档编码器和问题编码器为共享同一套训练参数的预训练语言模型网络;2)用文档编码器离线预计算设定文档中各候选答案的上下文表示向量;3)用问题编码器在线编码当前问题的表示向量;4)计算该问题的表示向量与每一候选答案的上下文表示向量之间的相似度;5)找到相似度最高的候选答案在该设定文档中的位置边界信息;6)通过修改该位置边界信息,从该设定文档中确定出若干高质量候选答案;7)用排序器对各高质量候选答案进行排序,选择出排序在最前的高质量答案做为该问题的最终答案。

Patent Agency Ranking