-
公开(公告)号:CN115860081B
公开(公告)日:2023-05-26
申请号:CN202310179898.2
申请日:2023-03-01
Applicant: 之江实验室
Abstract: 本发明涉及一种芯粒算法调度方法,包括:获取待调度的神经网络算法计算图;获取芯粒的拓扑结构,并基于拓扑结构生成芯粒资源列表;对神经网络算法计算图进行图优化;对计算图划分并行组;对计算图进行活跃性分析;生成计算图中的每个算子的策略和对应的开销;生成整数线性规划的优化变量;设定整数线性规划的求解目标;设定整数线性规划的约束条件;求解整数线性规划问题;将求解整数线性规划问题得到的解作为计算图在芯粒上的调度方法。与现有技术相比,本发明基于整数线性规划技术,将算法调度空间搜索问题转换成整数线性规划求解问题,通过设置多种求解约束缩小策略探索空间,能够在很短的时间内得到神经网络算法在芯粒上最优的调度方案。
-
公开(公告)号:CN115409174B
公开(公告)日:2023-03-31
申请号:CN202211354686.5
申请日:2022-11-01
Applicant: 之江实验室
Abstract: 本发明公开一种基于DRAM存内计算的碱基序列过滤方法与装置,该方法为:步骤一,根据DRAM的存储阵列的列宽和所要筛选目标碱基序列的起点地址,筛选出目标碱基序列后进行重新整理组合;步骤二,对重新整理组合后的目标碱基序列分别进行碱基为A腺嘌呤、G鸟嘌呤、C胞嘧啶、T胸腺嘧啶的标记并获取到对应碱基的标记行;步骤三,对标记行数据进行移位后统计标记行中位置值为1的个数,获得对应碱基的统计结果;步骤四,利用参考碱基序列的统计结果与所述目标碱基序列的统计结果进行对比,过滤所筛选的目标碱基序列。本发明将位置匹配筛选放置在内存子阵列中进行,减少了大量数据在cpu与内存之间的搬移,成倍提升了计算效率,降低了功耗。
-
公开(公告)号:CN115828831A
公开(公告)日:2023-03-21
申请号:CN202310110451.X
申请日:2023-02-14
Applicant: 之江实验室
IPC: G06F30/392 , G06N3/08 , G06F115/12
Abstract: 本发明公开了一种基于深度强化学习的多芯粒芯片算子放置策略生成方法,包括:获取算子计算图和多芯粒芯片尺寸信息;根据多芯粒芯片尺寸信息生成可选的若干种目标放置芯粒网格尺寸;建立多芯粒芯片算子放置深度学习强化模型,其中多芯粒芯片算子放置深度学习强化模型包括算子运行环境模块和深度Q网络模块,算子运行模块用于根据当前环境网络和输入的动作,计算奖励值,并将环境变换到下一个状态,将奖励值和下一个状态传回深度Q网络模块,深度Q网络模块用于根据当前状态从可选的动作空间中选择价值最高的动作;基于算子运行环境模块对深度Q网络模块进行训练;利用训练好的深度强化学习模型对算子计算图在多芯粒芯片上的运行给出算子放置策略。
-
公开(公告)号:CN115186821B
公开(公告)日:2023-01-06
申请号:CN202211108864.6
申请日:2022-09-13
Applicant: 之江实验室
Abstract: 本发明公开了面向芯粒的神经网络推理开销估计方法及装置、电子设备,其中面向芯粒的神经网络推理开销估计方法包括神经网络参数和芯粒拓扑结构获取、并行组内开销估计、并行组间网络传输开销估计及神经网络推理开销估计四个步骤。使得推理开销估计适用于神经网络在芯粒上并行调度的实际场景,神经网络推理开销估计能够适用于芯粒这样的拓扑结构,充分考虑芯粒上小芯片单元内外的带宽、小芯片单元内路由转发延迟和小芯片单元外路由转发延迟,使得神经网络在芯粒上的推理开销估计达到较高的精度,从而为神经网络在芯粒上加速推理所需的高性能调度策略奠定良好基础。
-
公开(公告)号:CN116469856B
公开(公告)日:2024-07-26
申请号:CN202310731637.7
申请日:2023-06-20
Applicant: 之江实验室
IPC: H01L23/473 , H01L23/367
Abstract: 本发明公开了一种带歧管微通道结构的冷却芯片和冷却方法,包括有机基板,所述有机基板上设置有转接板;所述转接板上设置有歧管盖板;所述歧管盖板和转接板之间形成空腔;所述空腔内,在转接板上设置有芯片组,所述芯片组上设置有微通道;所述歧管盖板设置有冷却液进口、冷却液出口、若干个进口分液歧管和若干个出口分液歧管;所述冷却液进口与所述若干个进口分液歧管连通;所述冷却液出口与所述若干个出口分液歧管连通;所述歧管盖板与芯片组和微通道之间形成若干个两相通路。本发明在两相通路中完成相变吸热过程直接带走芯片散发热量,并可以通过改变微通道的结构形状与微通道的疏密程度实现调节散热量的大小。
-
公开(公告)号:CN116977525B
公开(公告)日:2024-03-01
申请号:CN202310956092.X
申请日:2023-07-31
Applicant: 之江实验室
Abstract: 本说明书公开了一种图像渲染方法、装置、存储介质及电子设备。所述图像渲染方法包括:将预设的三维渲染计算框架展示给用户,以使用户从预设的三维渲染计算框架所提供的各组件中,选取出用于构建用户所需的三维场景模型的神经辐射场的各组件,作为各目标组件,其中,各组件包括:编码函数组件、多层感知器组件、损失函数组件。根据各目标组件,构建三维场景模型对应的目标神经辐射场,响应用户发送的渲染请求,通过构建出的目标神经辐射场进行渲染得到三维场景模型的渲染图像。
-
公开(公告)号:CN116225669B
公开(公告)日:2024-01-09
申请号:CN202310509060.5
申请日:2023-05-08
Applicant: 之江实验室
Abstract: 本说明书公开了一种任务执行方法、装置、存储介质及电子设备,可以预先确定出所有可以并行执行的算子组合,进而可以在响应于用户发起的任务请求进行任务执行时,确定需要执行该任务对应的各可执行算子与正在执行其他任务的芯片正在执行的其他任务的算子是否有匹配的可以并行执行的算子组合,若有,则可以通过正在执行其他任务的芯片并行执行该任务请求对应的任务,从而可以提升芯片的计算资源的利用率。
-
公开(公告)号:CN117056279A
公开(公告)日:2023-11-14
申请号:CN202311320181.1
申请日:2023-10-12
Applicant: 之江实验室
IPC: G06F15/78 , H01L23/538 , H01L23/528 , H01L21/60
Abstract: 本申请提供一种可重构电路、可重构芯粒间互联的装置及其方法。该可重构电路包括可重构互联模块及控制模块,可重构互联模块用于与一个微凸点组对应连接,微凸点组包括多个微凸点。可重构互联模块包括多个可重构的开关单元。每一个开关单元具有控制端、输入端及输出端,开关单元的控制端连接到控制模块,开关单元的输入端用于接收来自功能模块或测试模块的接口信号,开关单元的输出端用于连接微凸点组中的一个微凸点。控制模块用于接收外部的控制数据,并根据控制数据来控制可重构互联模块中多个开关单元的通断以选择合适的微凸点连通。在开关单元闭合时,与开关单元连接的对应微凸点连通,接口信号可通过开关单元的输入端传递到微凸点。
-
公开(公告)号:CN116627894A
公开(公告)日:2023-08-22
申请号:CN202310893529.X
申请日:2023-07-20
Applicant: 之江实验室 , 中国科学院计算技术研究所
IPC: G06F15/78
Abstract: 本申请涉及一种介质访问控制层、通信方法和系统,其中,介质访问控制层包括:数据链路协议桥模块,用于建立所述片内通信接口和所述片间通信接口之间的逻辑数据链路;介质访问控制器模块,用于将所述片内通信接口数据编码为所述片间通信接口的规格所对应的帧数据,并将所述帧数据传输至所述片间通信接口;配置模块,用于接收并解析所述数据链路协议桥模块传输的配置包,以配置所述片间通信接口。本申请解决了介质访问控制层无法兼容市面上的各种不同规格的片间通信接口,导致无法复用的问题。
-
公开(公告)号:CN116523045A
公开(公告)日:2023-08-01
申请号:CN202310235465.4
申请日:2023-03-13
Applicant: 之江实验室
Abstract: 本发明公开了一种面向多芯粒芯片的深度学习推理模拟器,包括:配置输入层,用于获取模拟所需的深度学习模型、多芯粒芯片架构和映射策略;模型解析层,用于根据映射策略对所述深度学习模型进行解析,得到模型解析表;路由生成层,用于根据模型解析表中每个算子的运行策略分析算子内路由和算子间路由并生成路由文件;推理模拟层,用于进行深度学习模型在多芯粒芯片架构所描述的多芯粒芯片上的推理模拟,将路由文件分层次并通过片上网络模拟器进行多进程并行模拟,得到各算子路由所需的周期数;结果计算层,用于将推理模拟层中并行模拟得到的算子路由周期数进行整理计算,得到深度学习模型在多芯粒芯片上推理模拟的周期数和平均设备利用率。
-
-
-
-
-
-
-
-
-