处理器、浮点运算单元和运算方法

    公开(公告)号:CN119512499A

    公开(公告)日:2025-02-25

    申请号:CN202411163376.4

    申请日:2023-08-24

    Abstract: 本申请公开的实施例属于计算技术领域,特别涉及一种处理器、浮点运算单元和运算方法。在处理器中包括数据搬运单元和浮点运算单元,在数据搬运单元中除实现数据搬运功能的数据搬运模块外,还包括数据解压模块。其中,数据解压模块可以对AI模型中经过压缩处理的第一权重数据进行解压处理,得到通过浮点数表示的第二权重数据。数据搬运单元可以将第一激活数据和第二权重数据搬运至浮点运算单元,进行浮点运算。采用本申请,可以对压缩处理后的第一权重数据与未压缩处理的第一激活数据进行浮点运算,如此在对AI模型进行量化压缩时,可以仅对权重数据进行压缩处理,能够降低量化压缩对AI模型精度的影响。

    一种机器学习模型的训练方法和相关装置

    公开(公告)号:CN117952168A

    公开(公告)日:2024-04-30

    申请号:CN202211351733.0

    申请日:2022-10-31

    Abstract: 本申请实施例公开了一种机器学习模型的训练方法和相关装置,用于解决CPU和NPU需要进行频繁的环境交互与网络交互带来带宽压力问题。本申请实施例方法在神经网络处理器上执行,包括:获取样本环境数据;根据样本环境数据训练环境模型;将环境模型与智能体模型进行交互,得到状态动作序列;将状态动作序列提供给智能体模型进行训练,并将训练后的智能体模型继续与环境模型进行交互,直到智能体模型的损失值收敛到预设值,得到训练后的智能体模型。

    一种数据处理方法、装置及相关设备

    公开(公告)号:CN117217296A

    公开(公告)日:2023-12-12

    申请号:CN202211289095.4

    申请日:2022-10-20

    Abstract: 本申请提供一种数据处理方法、装置及相关设备,该方法包括:计算设备根据待压缩的多个第一数据确定第一基准值;然后计算每个第一数据与第一基准值的差值;确定每个差值对应的编码;根据每个编码得到对应的第一数据被压缩后的数据。其中,各个第一数据对应的编码中的部分或全部编码的长度小于原第一数据的长度。上述基准值是待压缩的多个数据中出现次数较多的数据,待压缩的多个数据分别与基准值做差值时,得到的多个差值中0的数量最多,将差值进行编码后,能够将差值对应的数据压缩到较少的位数;由于编码所占的比特位小于各个数据,从而能够实现对数据的压缩,降低不同计算设备之间交互的数据量,提高数据传输效率。

    处理器、浮点运算单元和运算方法

    公开(公告)号:CN119512498A

    公开(公告)日:2025-02-25

    申请号:CN202311086354.8

    申请日:2023-08-24

    Abstract: 本申请公开的实施例属于计算技术领域,特别涉及一种处理器、浮点运算单元和运算方法。在处理器中包括数据搬运单元和浮点运算单元,在数据搬运单元中除实现数据搬运功能的数据搬运模块外,还包括数据解压模块。其中,数据解压模块可以对AI模型中经过压缩处理的第一权重数据进行解压处理,得到通过浮点数表示的第二权重数据。数据搬运单元可以将第一激活数据和第二权重数据搬运至浮点运算单元,进行浮点运算。采用本申请,可以对压缩处理后的第一权重数据与未压缩处理的第一激活数据进行浮点运算,如此在对AI模型进行量化压缩时,可以仅对权重数据进行压缩处理,能够降低量化压缩对AI模型精度的影响。

    聚合通信中的数据传输方法以及系统

    公开(公告)号:CN117785499A

    公开(公告)日:2024-03-29

    申请号:CN202211160846.2

    申请日:2022-09-22

    Inventor: 端启航 王均松

    Abstract: 本申请提供了一种聚合通信中的数据传输方法以及系统,属于分布式计算领域。该方法包括:第一计算设备获取第一计算设备的发送索引表,该发送索引表用于指示第一计算设备待发送的多个数据块中每个数据块对应的第二计算设备的信息,该第二计算设备的信息指示接收每个数据块的计算设备;第一计算设备根据该发送索引表分别发送多个数据块至多个第二计算设备;多个第二计算设备分别接收多个数据块,且每个第二计算设备所接收的数据块为连续的数据块。该数据传输过程不用进行数据块拷贝,节约了非连续的数据块在不同进程之间传输的时间,从而解决了通信环节耗时巨大的问题,突破了分布式计算的性能瓶颈。

    运算方法、处理器和计算设备
    6.
    发明公开

    公开(公告)号:CN119065630A

    公开(公告)日:2024-12-03

    申请号:CN202311092509.9

    申请日:2023-08-28

    Abstract: 本申请公开的实施例属于计算技术领域,特别涉及一种运算方法、处理器和计算设备。该方法由包括数据搬运单元和数据运算单元的处理器执行,包括:数据搬运单元获取AI模型中激活向量和经过量化后的权重向量,权重向量为整型数,激活向量为浮点数。数据搬运单元将权重向量中每个元素的符号位和尾数位,作为指数为0的浮点数的符号位和尾数位,输入至数据运算单元,并将激活向量中每个元素输入至数据运算单元。数据运算单元对输入的权重向量和激活向量进行向量运算,得到运算结果。采用本申请能够在数据运算单元中实现整型数与浮点数的运算,如此在对AI模型进行量化压缩时,可以仅对权重数据进行压缩处理,能够降低量化压缩对AI模型精度的影响。

    一种任务调度方法及相关系统
    7.
    发明公开

    公开(公告)号:CN119862000A

    公开(公告)日:2025-04-22

    申请号:CN202311370341.3

    申请日:2023-10-20

    Abstract: 本申请提供一种任务调度方法,应用于人工智能(Artificial Intelligence,AI)技术领域,包括:获取计算图,计算图中包括多个算子,多个算子中的每个算子代表一个任务,根据计算图中多个算子的依赖关系,对多个算子进行排序,获得有序算子序列,有序算子序列中包括第一算子和依赖第一算子的第二算子,第一算子排列在第一算子之前,根据有序算子序列对多个算子分组,获得多个算子组,根据多个算子组的优先级,将多个算子组顺序调度至设备。该方法通过对排序后的算子分组,以算子组为粒度进行任务下发,实现计算图有限并发下的有效调度,避免并发度过大导致内存复用概率下降、缓存命中率下降,提高了AI模型的计算效率和性能。

    一种数据处理方法、装置及相关设备

    公开(公告)号:CN119180313A

    公开(公告)日:2024-12-24

    申请号:CN202411146893.0

    申请日:2022-10-20

    Abstract: 本申请提供一种数据处理方法、装置及相关设备,该方法包括:计算设备根据待压缩的多个第一数据确定第一基准值;然后计算每个第一数据与第一基准值的差值;确定每个差值对应的编码;根据每个编码得到对应的第一数据被压缩后的数据。其中,各个第一数据对应的编码中的部分或全部编码的长度小于原第一数据的长度。上述基准值是待压缩的多个数据中出现次数较多的数据,待压缩的多个数据分别与基准值做差值时,得到的多个差值中0的数量最多,将差值进行编码后,能够将差值对应的数据压缩到较少的位数;由于编码所占的比特位小于各个数据,从而能够实现对数据的压缩,降低不同计算设备之间交互的数据量,提高数据传输效率。

Patent Agency Ranking