仲裁型物理不可克隆的激励响应生成方法及其电路

    公开(公告)号:CN117527249A

    公开(公告)日:2024-02-06

    申请号:CN202311238730.0

    申请日:2023-09-22

    Abstract: 本发明提出一种仲裁型物理不可克隆的激励响应生成方法和装置,包括:基于PUF构建的PUF满二叉树,树中每个PUF均具有信号输入端、激励输入端和信号输出端;通过PUF树构建步骤在目标设备中构建两个PUF树,分别为第一PUF树和第二PUF树,将输入信号输入第一PUF树和第二PUF树的头节点的信号输入端,将激励信号输入每个节点的激励输入端,进而从第一PUF树和第二PUF树所有尾节点的信号输出端得到输出信号;从第一PUF树所有尾节点中选择一路输出信号作为第一输出,从第二PUF树所有尾节点中选择一路输出信号作为第二输出;将第一输出和第二输出输出至仲裁器件,根据第一输出和第二输出到达仲裁器件的先后顺序,生成响应,保存激励信号和响应作为目标设备的激励响应对。

    一种基于节点任务重排序的图神经网络执行方法及系统

    公开(公告)号:CN115952825A

    公开(公告)日:2023-04-11

    申请号:CN202211551438.X

    申请日:2022-12-05

    Abstract: 本发明提出一种基于节点任务重排序的图神经网络执行方法和系统,包括:对图数据中目的节点进行分块,对图数据中源节点进行分窗口;分块中目的节点进行邻居特征的聚合;当前分块中目的节点均与当前窗口中的源节点完成聚合后,判断当前分块中是否有目的节点已完成全部邻居节点的聚合,若有,则从当前分块中删除,并根据删除的目的节点个数,将已准备好节点特征向量与边表的目的节点作为新节点加入当前分块;否则,维持当前分块中的目的节点不变;直到所有窗口均完成一次遍历,重新取首个源节点窗口作为当前窗口;当前分块中未从首个窗口中聚合邻居特征的目的节点,将与其它新加入当前分块中的目的节点一同,从首个窗口开始执行聚合操作。

    一种基于跨迭代数据预取的图计算加速方法及系统

    公开(公告)号:CN115797148A

    公开(公告)日:2023-03-14

    申请号:CN202211550910.8

    申请日:2022-12-05

    Abstract: 本发明提出一种基于跨迭代数据预取的图计算加速方法和系统,包括:获取使用节点和边进行描述的图数据及其对应的图计算任务,通过由用于边遍历的Scatter步骤和用于节点属性更新和激活的Apply步骤依次迭代处理该图数据,得到该图计算任务的执行结果;该Apply步骤,对该图数据节点进行更新与激活,其中选出出度或入度小于阈值的激活节点作为跨迭代预取节点,通过预见性预取器预取该跨迭代预取节点的边信息和节点属性,并保存在边表缓存中;该Scatter步骤,该边表缓存中直接获取属于上一迭代跨迭代预取节点的激活节点信息,其余激活节点信息通过访问外存获取,以对激活节点进行边遍历。通过为节点提前进行信息预取,从而缓解高延迟不规则访存的压力。

    一种基于超导快速单磁通量子逻辑门的数字突触电路

    公开(公告)号:CN118153696A

    公开(公告)日:2024-06-07

    申请号:CN202311799038.5

    申请日:2023-12-25

    Abstract: 本发明提出一种基于超导快速单磁通量子逻辑门的数字突触电路,包括:控制模块,用于接收时钟信号和突触前神经元的脉冲序列,并控制权重序列的产生;由两输出T型触发器级联的TFF2触发器序列,该触发器序列接收该脉冲序列用于解码存储权重数据的非破坏性读取(NDRO)序列;由NDRO级联的NDRO序列,用于存储权重数据;突触配置模块,与该NDRO序列中各NDRO的置位端与复位端相连;其中,该触发器序列中触发器的第一输出端口接至该NDRO序列中对应的NDRO,该触发器序列中最后一级触发器的输出端口产生终止信号至该控制模块;该NDRO序列中各NDRO输出的脉冲合并,得到合并脉冲。

    针对动态图快照的CPU-GPU异构并发图处理方法及系统

    公开(公告)号:CN117971485A

    公开(公告)日:2024-05-03

    申请号:CN202410161999.1

    申请日:2024-02-04

    Abstract: 本发明提出一种针对动态图快照的CPU‑GPU异构并发图处理方法和系统,包括:提取所有图快照的公共子图和每个图快照对应变化的子图,从而形成子图Gs和Gc;将公共子图Gs,依据GPU显存大小和顶点度的属性信息,划分为两部分,分别为Gs0和Gs1,之后将Gs0在初始时一次性拷贝到GPU显存中,Gs1则在迭代处理过程中,按需进行数据重组后,然后以异步多流的方式拷贝到GPU显存中;基于GPU和CPU的计算资源,图处理过程中以顶点为中心,同步迭代方式执行图处理算法。

    一种超高速、超低功耗的超导神经元电路

    公开(公告)号:CN117829229A

    公开(公告)日:2024-04-05

    申请号:CN202311797379.9

    申请日:2023-12-25

    Abstract: 本发明提出一种超高速、超低功耗的超导神经元电路,包括串联的第一约瑟夫森结、第二约瑟夫森结、第三约瑟夫森结和电感;为超导神经元电路的输入端施加偏置电流,偏置电流通过第一约瑟夫森结接地,同时偏置电流也可以通过第二约瑟夫森结、第三约瑟夫森结和电感接地;第一约瑟夫森结,用于接收输入端的脉冲输入并产生相位差翻转,翻转后释放磁通量子,磁通量子通过第三约瑟夫森结存入电感;第二约瑟夫森结,与电感的输出端相连,当电感内存储的磁通量子超过一定数量时,会导致通过第二约瑟夫森的电流超过临界值,随后第二约瑟夫森结翻转并发出一个脉冲信号至超导神经元电路的输出端。采用电感作为磁通量子的收集部件,避免了存储电路的消耗。

    一种基于数据流架构的深度可分离卷积融合方法及系统

    公开(公告)号:CN113313251B

    公开(公告)日:2023-05-23

    申请号:CN202110522385.8

    申请日:2021-05-13

    Abstract: 本发明提出一种基于数据流架构的深度可分离卷积融合方法和系统,包括:将输入图像数据、卷积参数从主存DRAM搬运到数据缓存SPM;PE阵列通过从数据缓存SPM中读取该输入图像数据、卷积参数,以执行DW卷积,并将得到的DW卷积结果存储在PE内的寄存器中;PE阵列对寄存器中DW卷积结果进行激活计算得到该输入图像数据的初步结果Act_out,将该初步结果Act_out写回数据缓存SPM后,进一步存回主存;PE阵列通过从数据缓存SPM中读取初步结果Act_out与卷积参数,执行PW卷积得到最终结果Output;将最终结果Output写回数据缓存SPM后,进一步存回主存DRAM。本发明减少了数据的存储与访问带来的开销,使得深度可分离式卷积计算在数据流架构上的计算实现加速。

    生成面向超导RSFQ电路的多扇出时钟信号的方法

    公开(公告)号:CN111950215B

    公开(公告)日:2023-04-28

    申请号:CN202010703091.0

    申请日:2020-07-21

    Abstract: 提供一种生成面向超导RSFQ电路的多扇出时钟信号的方法,其中N是扇出时钟信号的数量,N个扇出时钟信号的每一个与从时钟源点到时钟端点所经过的由SPL构成的分支路径相对应,由SPL构成的分支路径构成SPL树,所述方法包括:建立高度P为1的SPL树,将其存入集合R;根据N计算SPL树的最大高度Pmax;自底向上逐层建立SPL树,每次迭代P增加1,直到P>Pmax,并将所得到的SPL树存入集合R中;选择所述集合R中叶节点数为N的树构成最优解;根据所述最优解确定多扇出时钟信号的由SPL构成的分支路径;其中,高度为P的树是由所述集合R中高度为P‑1的子树组成的。

    超导处理器及其输入输出控制模块

    公开(公告)号:CN112861463B

    公开(公告)日:2023-04-25

    申请号:CN202110266205.4

    申请日:2021-03-11

    Abstract: 提供一种用于超导处理器的输入输出控制模块,包括:取指令状态寄存器,用于指示取指令状态或者非取指令状态,以及用于将指令地址输出到内存;读数据等待状态寄存器,用于根据处理器的读数据请求以及取指令状态寄存器由取指令状态转换至非取指令状态,将读数据地址由暂存转换为输出到内存;读数据状态寄存器,用于指示读数据状态,以及用于将读数据地址输出到内存;写数据等待状态寄存器,用于根据处理器的写数据请求以及取指令状态寄存器由取指令状态转换至非取指令状态,将写数据地址和写数据内容由暂存转换为输出到内存;写数据状态寄存器,用于指示写数据状态,以及用于将写数据地址和写数据内容输出到内存。

    一种应用于分布式计算节点集群的图数据处理方法和介质

    公开(公告)号:CN111737540B

    公开(公告)日:2022-11-29

    申请号:CN202010460064.5

    申请日:2020-05-27

    Abstract: 本发明实施例提供了一种图数据处理方法,包括:S1、获取包含多个顶点的图数据,按顶点的出度由小到大的顺序对顶点排序并将排序序号作为第一重排序ID;S2、根据第一重排序ID将图数据的顶点按预设粒度以轮询方式依次分配到分布式计算节点集群中的每一个分布式计算节点;S3、计算节点使用混合BFS算法对其获得的部分图数据进行遍历,每层遍历后各计算节点得到局部的下一层活跃顶点集;S4、每层遍历后相邻计算节点间进行环形通信以传递局部的下一层活跃顶点集,在部分层遍历后传递局部的下一层活跃顶点集之前,确定本次待传递的局部的下一层活跃顶点集的压缩方式,本发明通过顶点的出度对顶点ID进行重排序、数据压缩和环形通信,提高了通信效率。

Patent Agency Ranking