Patent search ap:("中国科学院计算技术研究所" OR "无锡江南计算技术研究所") AND inv:"范东睿" Page 17

161.

发明公开
一种数据流众核处理器的数据预取方法及处理器审中-实审

公开(公告)号：CN118132462A

公开(公告)日：2024-06-04

申请号：CN202410263613.8

申请日：2024-03-08

Applicant: 中国科学院计算技术研究所

Inventor： 秦善天 , 李文明 , 范志华 , 安学军 , 叶笑春 , 范东睿

IPC: G06F12/0811 , G06F12/0866 , G06F15/78

Abstract: 本发明提供了一种数据流众核处理器的数据预取方法及处理器，方法包括：对于待执行的程序，将程序执行所需的数据划分为可预取数据和不可预取数据；对于可预取数据，在程序执行前加载至处理器的片上存储，且在程序执行前将片上存储中存有所述可预取数据的缓存路设为不可被覆盖的只读状态；对于不可预取数据，在程序执行过程中按需加载至片上存储，有效地减少了对片外存储的访问请求次数，降低了平均访问延迟；并且在程序执行前将片上存储中存有所述可预取数据的缓存路设为不可被覆盖的只读状态，使得可预取数据在程序执行完毕前被稳定地保持在片上存储中。

162.

发明授权
一种基于卷积神经网络的图像检测方法及系统有权

公开(公告)号：CN112288085B

公开(公告)日：2024-04-09

申请号：CN202011147836.6

申请日：2020-10-23

Applicant: 中国科学院计算技术研究所

Inventor： 吴欣欣 , 范志华 , 轩伟 , 李文明 , 叶笑春 , 范东睿

IPC: G06N3/082 , G06N3/0464

Abstract: 本发明提出一种卷积神经网络加速方法及系统，包括将待特征分析的图像作为输入激活输入卷积神经网络，分解该卷积神经网络中滤波器的权值向量，得到滤波器中权值对应的符号向量；通过符号向量与输入激活向量执行卷积运算，得到第一卷积结果，通过补偿因子与输入激活向量执行卷积运算，得到第二卷积结果，将该第一卷积结果和第二卷积结果相加，得到预测结果；该卷积神经网络执行卷积计算时根据该预测结果跳过0值相关的运算，得到卷积结果。本发明可预知输出激活的稀疏度，以指导原始的神经网络运算跳过0值相关的运算，从而减少原始网络的计算量，节省计算资源、降低功耗并提升性能。

163.

发明授权
一种三维芯片及其芯片间通信方法有权

公开(公告)号：CN114416618B

公开(公告)日：2024-03-12

申请号：CN202111553453.3

申请日：2021-12-17

Applicant: 中国科学院计算技术研究所

Inventor： 王鹏超 , 郝沁汾 , 叶笑春 , 范东睿

IPC: G06F13/40 , G06F13/42

Abstract: 本发明提出一种三维芯片，包括：多个堆叠的芯片层，每个该芯片层包括至少一个芯片；层间通信模块；该芯片与该层间通信模块通过硅通孔通信连接；第一芯片层的发送芯片通过该层间通信模块向第二芯片层的接收芯片发送数据信息。还提出一种三维芯片的芯片间通信方法，包括：当第一芯片层的发送芯片拟向第二芯片层的接收芯片发送数据信息时，由该发送芯片向层间通信模块发送握手信息，该握手信息中包括该接收芯片的芯片地址；由该层间通信模块根据该芯片地址，以该握手信息进行该发送芯片与该接收芯片之间的握手操作；根据握手结果，由该层间通信模块接收该数据信息并传输至该接收芯片。

164.

发明授权
一种对CPU互连系统的网络拓扑结构进行重构的方法及装置有权

公开(公告)号：CN113127404B

公开(公告)日：2024-03-08

申请号：CN202110430491.3

申请日：2021-04-21

Applicant: 中国科学院计算技术研究所

Inventor： 秦梦远 , 郝沁汾 , 叶笑春 , 范东睿

IPC: G06F15/173 , G06F15/177

165.

发明授权
带宽控制单元、处理器芯片以及访存流量控制方法有权

公开(公告)号：CN114610138B

公开(公告)日：2023-08-08

申请号：CN202210230341.2

申请日：2022-03-10

Applicant: 中国科学院计算技术研究所

Inventor： 李文明 , 安述倩 , 吴海彬 , 刘艳欢 , 张昆明 , 叶笑春 , 范东睿

IPC: G06F1/3234 , G06F1/3206

Abstract: 提供一种带宽控制单元，其用于包括多个数据处理单元的处理器芯片，所述多个数据处理单元通过总线对存储器进行访问，所述存储器包括优先级管理单元，所述带宽控制单元包括：第一温度判断模块，其用于接收所述多个数据处理单元的温度值，以及将所述温度值分别与相应的数据处理单元的温度阈值进行比较，并输出第一比较结果；以及优先级处理模块，其用于接收所述第一比较结果，以及根据所述第一比较结果调整所述多个数据处理单元中的一个或者多个的访存优先级；其中，所述优先级处理模块将调整后的访存优先级输出至所述存储器的优先级管理单元，以控制所述多个数据处理单元访存所述存储器的带宽。

166.

发明授权
基于数据流结构的低精度神经网络计算装置及加速方法有权

公开(公告)号：CN113298236B

公开(公告)日：2023-07-21

申请号：CN202110676008.X

申请日：2021-06-18

Applicant: 中国科学院计算技术研究所

Inventor： 范志华 , 吴欣欣 , 王珎 , 李文明 , 安学军 , 叶笑春 , 范东睿

IPC: G06N3/0464 , G06N3/063

Abstract: 本发明提供一种基于数据流结构的低精度神经网络计算装置，包括输入缓存区，输出缓存区、权重缓存区以及PE阵列，其中，PE阵列中的每个PE包括乘加部件，所述乘加部件以SIMD方式进行乘加运算。本发明还提供一种基于上述装置的低精度神经网络加速方法。本发明节省了计算资源，减少了访存带来的开销。

167.

发明授权
基于数据流架构的稀疏卷积神经网络加速方法及系统有权

公开(公告)号：CN112015473B

公开(公告)日：2023-06-27

申请号：CN202010719417.9

申请日：2020-07-23

Applicant: 中国科学院计算技术研究所

Inventor： 吴欣欣 , 范志华 , 轩伟 , 李文明 , 叶笑春 , 范东睿

IPC: G06F9/30 , G06F9/32 , G06N3/10 , G06N3/0464 , G06N3/0495 , G06N3/082

Abstract: 本发明提出一种基于数据流架构的稀疏卷积神经网络加速方法及系统。针对稀疏卷积应用，使用软件方式设计了一套指令共享检测装置和稀疏卷积加速方法。通过对编译器生成的指令进行检测和对比，标记所有指令中指令内容完全相同的指令，将这些指令的地址设置为相同的地址，实现稀疏卷积中指令共享，从而减少了指令加载对内存的访问，提升了稀疏卷积运行的时间。

168.

发明授权
一种面向图神经网络应用的任务调度执行系统及方法有权

公开(公告)号：CN111694643B

公开(公告)日：2023-04-11

申请号：CN202010395810.7

申请日：2020-05-12

Applicant: 中国科学院计算技术研究所

Inventor： 严明玉 , 李涵 , 叶笑春 , 曹华伟 , 范东睿

IPC: G06F9/48 , G06N3/042

Abstract: 本发明提出一种面向图神经网络应用的任务调度执行系统及方法，包括：待发射图运算符缓存模块读取待处理图运算符处理请求，根据待处理图运算符处理请求的图运算符标签，从缓存中获取所需输入数据；发射单元将待处理图运算符处理请求和输入数据发送给基于静态数据流的统一结构处理单元；统一结构处理单元根据图运算符标签的图运算符码将输入数据映射到相应的二叉运算树的输入上和图运算符执行帧，并完成本轮运算，得到中间结果；标签生成器依据前一轮运算标签信息，生成新的图运算符标签；统一结构处理单元将中间结果以及新的图运算符标签返回给待发射图运算符缓存模块；循环执行直至图运算符标签中剩余重复次数数值为1，将当前中间结果写回缓存。

169.

发明公开
一种应用于处理器的分支预测方法以及分支预测器审中-实审

公开(公告)号：CN115686639A

公开(公告)日：2023-02-03

申请号：CN202211290962.6

申请日：2022-10-21

Applicant: 中国科学院计算技术研究所

Inventor： 范志华 , 王铎 , 汤胜中 , 李文明 , 安学军 , 叶笑春 , 范东睿

IPC: G06F9/38

Abstract: 本发明提供了一种应用于处理器的分支预测方法以及分支预测器，该分支预测方法包括：获取TAGE预测器对分支指令进行分支预测的第一中间参数以及第一预测值；获取GEHL预测器对所述分支指令进行分支预测的第二中间参数以及第二预测值；利用预设的组合预测器根据所述分支指令对应的PC值、第一中间参数、第一预测值、第二中间参数以及第二预测值中的指定比特位按照预定的规则重组确定多个子索引，并基于重组的多个子索引确定对应的第三预测值以及第三预测值的置信度；根据所述分支指令对应的PC值、第三预测值以及第三预测值的置信度生成查询索引，利用所述查询索引从预定的模式历史表中确定分支指令对应的最终预测值，从而提升分支预测的精度和处理器效率。

170.

发明公开
一种应用于图神经网络训练的采样方法及采样加速装置审中-实审

公开(公告)号：CN115600658A

公开(公告)日：2023-01-13

申请号：CN202211208844.6

申请日：2022-09-30

Applicant: 中国科学院计算技术研究所(CN)

Inventor： 刘昕 , 严明玉 , 李文明 , 曹华伟 , 叶笑春 , 范东睿

IPC: G06N3/0464 , G06N3/082 , G06N3/047

Abstract: 本发明提供一种应用于图神经网络训练的采样方法，用于在图神经网络训练过程中对图数据进行采样，所述采样方法包括：获取图数据中每个节点的所有邻居节点的存储位置，并以节点的所有邻居节点的存储位置随机排序构成该节点对应的邻居节点序列；基于得到的每个节点对应的邻居节点序列判断该节点的所有邻居节点是否符合集中分布；根据得到的每个节点的邻居节点的判断结果调整该节点被采样的概率，其中，将对应邻居节点符合集中的节点被采样的概率提高，将对应邻居节点不符合集中分布的节点被采样的概率降低；采用调整后的每个节点被采样的概率形成的概率分布对图数据进行采样。本发明减少了采样过程中的访存开销。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification