一种异构众核上基于主-从模型的轻量级多线程处理方法

    公开(公告)号:CN114217915B

    公开(公告)日:2025-01-10

    申请号:CN202110398335.3

    申请日:2021-04-14

    Abstract: 本发明公开一种异构众核上基于主‑从模型的轻量级多线程处理方法,设置四种线程状态,分别为初始化、等待任务、任务完成和线程退出;在共享内存上开辟长整形数组;在共享内存上开辟数组,用于线程组内主线程向从属线程传递参数;根据主线程及其从属线程核组号,设置每个线程组的掩码cgmask,掩码有CG_NUM位;使用共享模式运行并行程序,每个核组为一个进程;当需要退出线程状态时,主线程调用Master_leave接口;执行完毕后,各核组恢复进程状态,可以根据进程号继续执行任务。本发明为用户提供了方便使用、更加灵活、开销更低的片内多线程解决方案。

    一种基于任务循环划分策略的负载平衡方法

    公开(公告)号:CN114217940A

    公开(公告)日:2022-03-22

    申请号:CN202110381658.1

    申请日:2021-04-09

    Abstract: 本发明公开一种基于任务循环划分策略的负载平衡方法,包括以下步骤:S1、根据任务实际需求和线程的任务处理能力,将任务池中的每个任务划分为线程们可高效并行处理的若干子任务;S2、对S1中得到若干子任务编号,将任务池中的任务编号为taskid,每个任务划分后子任务编号为jobid,则每个子任务有唯一编号,记线程个数为n;S3、依次处理每个任务,根据S2中编号,将编号为(taskid,jobid)的子任务分配给第(jobid%n+taskid)%n个线程。本发明可以在异构众核处理器上多线程并行处理任务时,从整体上均衡各线程的任务负载,提升计算效率与系统稳定性。

    面向众核处理器的压缩感知稀疏重构加速方法

    公开(公告)号:CN117394863A

    公开(公告)日:2024-01-12

    申请号:CN202311403458.7

    申请日:2023-10-26

    Abstract: 本申请涉及一种面向众核处理器的压缩感知稀疏重构加速方法。所述方法包括:获取待采样数据的待采样信号,并确定待采样信号的初始稀疏向量;当对待采样信号进行压缩感知时,从内存读取第一测量矩阵和第二测量矩阵,对第一测量矩阵和第二测量矩阵进行张量积运算,生成测量矩阵,其中,测量矩阵为克罗内克结构;根据生成的测量矩阵对初始稀疏向量进行迭代更新,直至满足终止阈值条件,得到目标稀疏向量,以实现待采样信号的压缩感知稀疏重构。采用本方法可以减轻信号处理过程中内存的负担,提高压缩感知的运行效率和数据处理速率,灵活处理数据,具有可扩展性。

    一种处理器性能筛选方法
    4.
    发明公开

    公开(公告)号:CN114253705A

    公开(公告)日:2022-03-29

    申请号:CN202110381442.5

    申请日:2021-04-09

    Abstract: 本发明公开一种处理器性能筛选方法,包括以下步骤:将待筛选的处理器划分为n个子集;判断性能筛选是否完成;将处理器Pij的性能记为Aij;将子集i内所有处理器的性能值收集到根节点r,作为待分类的样本;选取分类数k,设置分类终止条件为k_thres;对于每个样本Aij,计算其到每个初始质心的欧式距离;S8、对于每个类别t,重新计算属于该类别的样本S[t]的平均值;对于每个类别t,将经过本轮筛选后剩余的处理器作为待筛选处理器,累加筛选总时间或筛选轮次,回到S1。本发明灵活性强、鲁棒性好,显著减少人为干预、利于筛片自动化,降低筛片人员工作负担和误操作可能,有助于提高筛片效率和效果。

    一种DNN算子库动态数据分块方法
    5.
    发明公开

    公开(公告)号:CN114217916A

    公开(公告)日:2022-03-22

    申请号:CN202110453158.4

    申请日:2021-04-26

    Abstract: 本发明公开一种DNN算子库动态数据分块方法,包括以下步骤:S1、用户调用所需算子,并传入一组由多个整数组成的参数,作为S2的输入;S2、根据S1中获取的参数大小和算法的参数适用范围,将一组参数划分为多组参数,并为各组参数选择不同的算法进行处理;S3、从S2获得参数,根据算法特点,为参数中各个维度[N,H,W,C]的数据设置优先级;S4、在保证内存充裕的前提下,将[N,H,W,C]按照参数中各个数据的优先级从高到低的顺序,依次增加其分块的大小;S5、将动态选择好的数据分块传递给对应的算法,调用算法,得出结果。本发明保证了算子性能的最佳发挥,不需要用户担忧众多算法如何抉择的问题,具有良好的用户体验。

    基于量子光滑性测试的经典与量子混合整数分解方法

    公开(公告)号:CN117313885A

    公开(公告)日:2023-12-29

    申请号:CN202311405211.9

    申请日:2023-10-27

    Abstract: 本申请涉及一种基于量子光滑性测试的经典与量子混合整数分解方法,该方法包括:获取信息安全计算时待因子分解的目标整数,根据平方同余类整数分解算法的要求确定目标整数对应的多个候选关系,候选关系的数量超过预设阈值;分别对每个候选关系进行光滑性判断,在满足预设的量子范数整数分解条件或量子余因子整数分解条件的情况下,对当前候选关系对应的范数进行量子整数分解,并根据分解结果判断当前候选关系是否为真关系,在当前候选关系为真关系的情况下,将当前候选关系作为目标关系;根据目标关系对目标整数进行分解。本申请采用上述方法,有助于提升确定真关系的效率,进而提升后续完成目标整数分解的效率。

    一种胖树网络结构上的通信优化方法

    公开(公告)号:CN114244708B

    公开(公告)日:2023-08-08

    申请号:CN202110452524.4

    申请日:2021-04-26

    Abstract: 本发明公开一种胖树网络结构上的通信优化方法,包括以下步骤:S1、假设每个超节点包含的节点数量为N,根据裁剪胖树裁剪比例1/X,计算每个超节点同时通信的最大进程数M=N*(1/X),M为同时通信时,理论上能用满带宽的超节点内最大进程数;S2、根据课题的通信方式,得到课题需要同时通信的进程数量K;S3、若K小于超节点内节点数量,将每个超节点按照K个进程为1组,分为若干组,转S;S4、按超节点内的组号和组内编号,结合具体的路由规则,对超节点进行逻辑编号;S5、按照新的逻辑编号和课题特征,依次进行组内和组间通信。本发明实现了应用课题和系统的结合,显著提高了课题的带宽利用率,充分发挥了系统的网络性能。

    一种胖树网络结构上的通信优化方法

    公开(公告)号:CN114244708A

    公开(公告)日:2022-03-25

    申请号:CN202110452524.4

    申请日:2021-04-26

    Abstract: 本发明公开一种胖树网络结构上的通信优化方法,包括以下步骤:S1、假设每个超节点包含的节点数量为N,根据裁剪胖树裁剪比例1/X,计算每个超节点同时通信的最大进程数M=N*(1/X),M为同时通信时,理论上能用满带宽的超节点内最大进程数;S2、根据课题的通信方式,得到课题需要同时通信的进程数量K;S3、若K小于超节点内节点数量,将每个超节点按照K个进程为1组,分为若干组,转S;S4、按超节点内的组号和组内编号,结合具体的路由规则,对超节点进行逻辑编号;S5、按照新的逻辑编号和课题特征,依次进行组内和组间通信。本发明实现了应用课题和系统的结合,显著提高了课题的带宽利用率,充分发挥了系统的网络性能。

    一种异构众核架构上基于算子融合的数据复用方法

    公开(公告)号:CN114239669A

    公开(公告)日:2022-03-25

    申请号:CN202110398219.1

    申请日:2021-04-14

    Abstract: 本发明公开一种异构众核架构上基于算子融合的数据复用方法,将DNN算子库中依次调用的至少两个算子A、B进行功能融合,获得融合算子C,执行以下操作:S1、融合算子C从主存中读取数据到局存中,并将读取的数据作为算子A的输入;S2、算子A将获取的数据作为输入,进行相应的运算,完成算子A的功能计算,此时算子A将结果保留在局存中不写回主存;S3、算子A将局存中的计算结果传递给算子B,作为算子B的输入;S4、算子B将来自算子A的数据作为输入;S5、算子B完成运算后,将最终的计算结果从局存写回主存;S6、算子C运算结束。本发明极大减少了内存访问次数,提高了数据的复用率,综合提升了可融合算子的效率。

Patent Agency Ranking