基于有向无环图模型的寄存器级从核消息传递方法

    公开(公告)号:CN108920288A

    公开(公告)日:2018-11-30

    申请号:CN201810716672.0

    申请日:2018-07-03

    Inventor: 陈庚 杨广文

    Abstract: 本发明提供的基于有向无环图模型的寄存器级从核消息传递方法,提出一种从源从核至目标从核消息传递的有向无环图模型,防止互锁,同时能够避免寄存器被占满的情况发生,从根本上克服了消息传递时可能存在的互锁情况,使用最小步数完成消息传递,实现了可靠高效的寄存器级消息传递。

    节点行列全互连网络的高效传输方法

    公开(公告)号:CN108965012B

    公开(公告)日:2021-08-03

    申请号:CN201810825747.9

    申请日:2018-07-25

    Abstract: 本发明通过先统筹排列再按顺序分时传输的方法对需要传输的任务进行传输,通过任务路径确定方法、路径确定策略及转置已确定任务策略将逻辑行列互连网络传输效率问题转化为时空互斥条件下的时间层最小化问题或者是各时间层内并发度最大化问题,相较传统传输模式,充分利用空闲节点,最大化填充网络,大幅度提升传输并发度,大幅提高传输效率,有效地缓解了传输不平衡问题及有效避免了拥堵和死锁的发生。

    基于申威处理器的深度学习算子自动优化系统及方法

    公开(公告)号:CN110929850A

    公开(公告)日:2020-03-27

    申请号:CN201911177238.0

    申请日:2019-11-26

    Abstract: 本发明提供的基于申威处理器的深度学习算子自动优化系统,包括获取单元,获取专用的描述语言定义计算任务和优化空间的描述;调度单元,根据优化空间的描述构建优化空间,依据优化空间中不同优化方法对计算任务描述调度生成若干不同的计算实现,输出用中间表示表达的计算实现;优化单元,接收中间表示,对中间表示执行优化,输出优化后的中间表示;优化空间搜索单元,从优化后的中间表示中搜索出最优的计算实现;代码生成单元,将最优的计算实现翻译为在申威处理器上可以执行的代码。本发明能够解决现有技术中优化性能低、难以移植、优化时间开销大的问题,高效于手动优化技术和自动优化技术,并且可以能够方便地移植到其他机构上使用。

    基于寄存器间通信的非对齐内存访问加速方法

    公开(公告)号:CN109766208A

    公开(公告)日:2019-05-17

    申请号:CN201910022433.X

    申请日:2019-01-10

    Abstract: 本发明提供的基于寄存器间通信的非对齐内存访问加速方法,属于计算机技术领域,包括:存储在DMA中数据点集沿y方向分隔为m行数据点集行;从核集群的一个x方向的m个从核从DMA中分别读取一行数据点集行;每个从核利用寄存器通信将其读取的数据点集行中的属于相应从核部分的数据通信给相应从核;其中,从核集群的x方向的从核个数为m;m个从核需要读取的数据依次沿x方向排列构成数据点集存储在DMA中。本发明通过分行读取与寄存器间通信相结合的方式,降低了数据的总体访问量,减少非对齐内存访问次数,提升DMA带宽的利用率。

    火箭子级回收动力下降阶段闭环制导方法

    公开(公告)号:CN116946391A

    公开(公告)日:2023-10-27

    申请号:CN202211522334.6

    申请日:2022-11-30

    Abstract: 本发明提供的火箭子级回收动力下降阶段闭环制导方法,涉及火箭制导回收方法,充分考虑非线性气动力的作用,通过末端误差法求解考虑非线性气动力的PDG问题进行轨迹规划,能够以可行的计算代价,在每次轨迹规划内部充分考虑非线性气动力的作用;并且轨迹规划成功率高,提高轨迹规划成功率的原因主要有:1.单次规划的加速使得可尝试的规划次数增加,能够提升规划成功率,并及时修正误差;2.能够利用箭载处理器的多个核心,并行运行冷启动和热启动的规划,也增加了尝试次数;3.降低了规划初始时间点延迟,从而降低了初始状态预测误差。

    二阶锥规划的求解器及用途
    10.
    发明公开

    公开(公告)号:CN114936346A

    公开(公告)日:2022-08-23

    申请号:CN202210601595.0

    申请日:2022-05-30

    Abstract: 本发明提供的二阶锥规划的求解器,涉及求解器,通过设置输入模块、求解模块和输出模块,在求解模块中置入面向火箭轨迹规划的二阶锥规划的求解方法。该求解器通过系数矩阵稀疏化,充分利用问题稀疏性进行加速;并且包含热启动模块,对于火箭轨迹规划等需要序列凸化的实际应用,能利用子问题间的相关性进一步加速收敛;同时在箭载处理器等国产设备上运行的程序全部为自主研发,仅有在通用设备进行预处理时需使用开源软件的计算结果。

Patent Agency Ranking