-
公开(公告)号:CN102609395A
公开(公告)日:2012-07-25
申请号:CN201110436062.3
申请日:2011-12-22
Applicant: 中国科学院自动化研究所
IPC: G06F17/14
Abstract: 本发明提供了一种单一内外交织结构的可变尺寸块状FFT运算装置。该装置主要包括:一个或多个块状运算装置、旋转因子存储装置、块内交织地址存储装置、块外存储控制器、块外交织地址存储装置、块外数据存储装置和块外数据通路选择器。其中块状运算装置包括:块内输入数据通路选择器、蝶形运算装置、块内存储控制器、块内数据存储装置和块内输出数据通路选择器。根据本发明,用户可根据选定的数据位宽,自动生成所有数据交织地址和旋转因子数值,存入相应的存储装置供硬件调用。本发明支持任意2n点数的FFT计算,经过分块处理以后,避免了寻址空间过于分散,提高了数据的封闭性。同时,由于每一块内的数据交织模式完全相同,所有块外的数据交织模式也完全相同,因此降低了数据交织寻址复杂度。
-
公开(公告)号:CN102411557A
公开(公告)日:2012-04-11
申请号:CN201110459907.0
申请日:2011-12-31
Applicant: 中国科学院自动化研究所
IPC: G06F17/14
Abstract: 本发明公开了一种多粒度并行FFT计算装置,包括三个存储器、蝶形计算装置、状态控制单元、数据反序网络和第一选择器,三个存储器均为多粒度并行存储器,用于存储蝶形组数据以及与蝶形组数据对应的旋转因子。蝶形计算装置根据从第一选择器输出的蝶形组数据和从一个存储器输出的与该蝶形组数据对应的旋转因子完成一个蝶形组的计算,并将计算结果写回其它两个存储器。本发明利用特定的读写粒度,可从多粒度并行存储器中并行读取蝶形组数据和对应的旋转因子,读取过程中不会产生存储器冲突,也不需要额外的步骤再对读写数据进行排序。
-
公开(公告)号:CN119377874A
公开(公告)日:2025-01-28
申请号:CN202411258035.5
申请日:2024-09-09
Applicant: 中国科学院自动化研究所
IPC: G06F18/25 , G06F16/334 , G06F16/3329 , G06F40/289
Abstract: 本公开提供了一种长文本知识的特征融合方法、装置、存储介质和电子设备。本公开的方法包括:将输入的长文本转换为N个分词,并将每个分词转换为d维的词向量;构建循环变换单元;以N个词向量和初始随机矩阵作为循环变换单元的输入以进行N次特征迭代,循环输出每次迭代的离散信息矩阵和全局信息向量;将循环变换单元第N次的迭代输出的离散信息矩阵和全局信息向量进行拼接,得到长文本的融合特征。本公开通过构建循环变换单元将长文本映射为互为关联的离散信息矩阵和全局信息向量,以实现对长文本的词向量特征的高效压缩,使任意长度的长文本知识均可以经过压缩形成固定大小的融合特征。
-
公开(公告)号:CN117290098A
公开(公告)日:2023-12-26
申请号:CN202311235987.0
申请日:2023-09-22
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种基于GPU内联直通的高速数据处理方法及装置,该基于GPU内联直通的高速数据处理方法包括:基于第一任务流并行接收多个高带宽数据包;对多个高带宽数据包分别进行解析,得到多个解析数据;将多个解析数据缓存至第一循环缓冲池;在接收到第一信号量的情况下,基于第二任务流从第一循环缓冲池读取并计算多个解析数据,得到计算结果;将计算结果缓存至共享存储区域的第二循环缓冲池,以供CPU通过第二循环缓冲池读取计算结果。本发明所述方法实现了GPU内部多流之间的同步,同时能够避免CPU与GPU直接进行数据传输,减少系统耗时,提高了数据处理的稳定性和实时性。
-
公开(公告)号:CN116418381A
公开(公告)日:2023-07-11
申请号:CN202310226191.2
申请日:2023-03-02
Applicant: 中国科学院自动化研究所 , 广东人工智能与先进计算研究院
Abstract: 本发明提供一种基于GPU计算平台的并行数字多波束合成方法及装置,该方法包括:将多组波束系数和多路天线数据从中央处理器CPU传输至GPU中;在所述GPU中,基于所述多组波束系数和所述多路天线数据,进行数字多波束合成;将数字多波束合成的结果从所述GPU传输至所述CPU中进行存储。通过将用于数字多波束合成的数据传输至GPU中进行并行加速处理,得到数字多波束合成的结果之后再传输回CPU中存储,可以显著减少波束合成时间,提高大规模数据下计算效率,保证天文观测的实时性。
-
公开(公告)号:CN116301717A
公开(公告)日:2023-06-23
申请号:CN202211469334.4
申请日:2022-11-22
Applicant: 中国科学院自动化研究所 , 广东人工智能与先进计算研究院
Abstract: 本发明提供一种乘加和的确定方法、装置、电子设备及存储介质,涉及计算机技术领域,该方法包括:基于至少一组操作数,确定至少一个目标片段;每一组操作数包括第一操作数和第二操作数;第一操作数的数据精度为q比特,第二操作数的数据精度为p比特;q和p均为正整数;基于各目标片段,生成至少一个目标乘积的目标乘积标志位;基于各目标乘积标志位和每一组操作数对应的符号标志位,生成各目标乘积的权重;基于各目标乘积和各目标乘积的权重,确定至少一组操作数对应的乘加和。本发明提供的方法,减少了冗余计算,从而减少能耗,提升了能量效率。
-
公开(公告)号:CN115629646A
公开(公告)日:2023-01-20
申请号:CN202211204240.4
申请日:2022-09-29
Applicant: 中国科学院自动化研究所 , 广东人工智能与先进计算研究院
IPC: G06F1/02
Abstract: 本发明提供一种波形输出方法、装置、硬件设备及计算机可读存储介质,硬件设备存储有软件设备发送的波形片段集,波形片段集包括至少一个波形片段,每个波形片段分别对应一个标签,该方法包括:接收软件设备发送的波形组合方式,波形组合方式是软件设备将每个波形片段的标签进行排列得到的;接收软件设备发送的指令包,并基于指令包,输出波形组合方式对应的任意波形。该方法在使用同一个波形片段集的情况下,仅需要获取不同的波形组合方式,以实现输出任意波形的改变,对于硬件设备而言,改变输出的任意波形仅需接收软件设备发送的更新数据量很小的输出波形组合方式即可,这样能够有效提高任意波形的输出效率。
-
公开(公告)号:CN113427498B
公开(公告)日:2022-08-23
申请号:CN202110757517.5
申请日:2021-07-05
Applicant: 广东人工智能与先进计算研究院 , 中国科学院自动化研究所 , 芯跳科技(广州)有限公司
Abstract: 本申请实施例提供一种触觉传感装置、机械手及机器人,触觉传感装置包括底座机构、多个压力传感器以及顶盖机构。底座机构具有一安装面;各压力传感器设置于安装面上,各压力传感器间隔分布于安装面上;顶盖机构包括顶盖层和多个压力传递柱,压力传递柱的一端与压力传感器的背离安装面的一面垂直抵接,另一端与顶盖层抵接,顶盖层设置于底座机构上,且覆盖各压力传递柱和各压力传感器,顶盖层的背离压力传递柱的外表面设有柔性层。上述的触觉传感装置、机械手及机器人,可以感应到外界物体一定区域内的压力分布特征,可准确地将面积内力的分布情况传递至压力传感器从而能够采集有效的数据用于材质识别,降低了制造成本。
-
公开(公告)号:CN111488219B
公开(公告)日:2022-08-02
申请号:CN202010266058.6
申请日:2020-04-07
Applicant: 中国科学院自动化研究所 , 广东人工智能与先进计算研究院
IPC: G06F9/50
Abstract: 本发明属于高速数据采集、网络数据处理领域,具体涉及一种用于高速数据采集系统的以太网数据流记录方法、系统、装置,旨在解决现有高速数据采集CPU利用率低、系统兼容性差、封装和部署困难以及系统传输可靠性低的问题。本系统方法包括:Linux操作系统启动后,隔离出设定数量的CPU核心;卸载操作系统内核态网卡驱动,创建huge page内存池,对各万兆网卡,分配其对应的数据接收缓存池及无锁FIFO缓存,并对各万兆网卡PCIE寄存器初始化,使其进入采集状态;以用户态轮询的驱动方式对各万兆网卡采集的数据包进行连续接收及磁盘记录。本发明提高了CPU利用率、系统兼容性和传输可靠性,降低了封装和部署难度。
-
公开(公告)号:CN111539997B
公开(公告)日:2022-06-10
申请号:CN202010326223.2
申请日:2020-04-23
Applicant: 中国科学院自动化研究所 , 广东人工智能与先进计算研究院
Abstract: 本发明属于图像配准技术领域,具体涉及一种基于GPU计算平台的图像并行配准方法、系统、装置,旨在解决现有技术中海量图像下基于傅里叶变换的图像配准算法处理效率低的问题。本发明提供的基于GPU计算平台的图像并行配准方法,将图像配准并行化,对海量图像进行多GPU任务划分,根据图像分辨率大小划分子任务,将子任务分配给GPU的线程块,在核函数内基于傅里叶变换的配准算法并行完成数据计算,从而对图像配准进行加速,且傅里叶变换的配准算法每一个子步骤均是在GPU核函数内完成,使得每个GPU内最大化并行效率。本发明采用异步传输的方式实现数据传输、配准、传回和写入磁盘三个过程流水线并行,提高了海量图像并行配准的效率,做到实时处理。
-
-
-
-
-
-
-
-
-