基于FPGA中高性能计算架构的通用定点矩阵乘法器的实现方法、装置及介质

    公开(公告)号:CN118690115A

    公开(公告)日:2024-09-24

    申请号:CN202410783729.4

    申请日:2024-06-18

    Abstract: 本发明公开了一种基于FPGA中高性能计算架构的通用定点矩阵乘法器的实现方法、装置及介质,其中方法包括:基于Versal ACAP平台的AI引擎阵列资源的并行性,设计不同层次的矩阵分块策略;基于AI引擎和AXI流的数据包流和数据包交换的数据调度和复用,通过矩阵分块乘法加速内核,设计数据调度和复用策略;在AI引擎向量处理器上实现高吞吐量向量化的矩阵乘法运算的流水线。本发明基于Versal ACAP平台的AXI流传输协议和AI引擎阵列实现了矩阵乘法的多层次分块,使矩阵乘法可以高效利用硬件资源有效提高数据复用率并且实现较高的并行度,在AI引擎的高速时钟下实现较高的运算速度。本发明可广泛应用于高性能计算领域。

    一种基于多源数据特征融合的多模态交通流量预测方法

    公开(公告)号:CN119323879A

    公开(公告)日:2025-01-17

    申请号:CN202411338723.2

    申请日:2024-09-25

    Abstract: 本发明公开了一种基于多源数据特征融合的多模态交通流量预测方法,包括:获取交通数据;根据交通数据划分训练集和测试集;构建交通预测模型,采用训练集对交通预测模型进行训练;采用测试集对交通预测模型进行验证;其中,交通预测模型包括:云图编码器,用于对云图数据进行特征提取,获得云图特征;时空编码器,用于对时空数据进行特征提取,获得时空特征;融合模块,用于将云图特征和时空特征进行融合,获得融合特征;将云图特征、时空特征和融合特征进行相加操作,输入时空解码器进行预测,获得最终的预测结果。本发明融合多方位多维度信息,精简时空特征提取过程中的冗余信息,实现了高效且高精度的预测,可广泛应用于交通流量预测技术领域。

    轻量级视觉Transformer的训练优化方法、装置及介质

    公开(公告)号:CN118690812A

    公开(公告)日:2024-09-24

    申请号:CN202410783754.2

    申请日:2024-06-18

    Abstract: 本发明公开了一种轻量级视觉Transformer的训练优化方法、装置及介质,其中方法包括:使用未训练的Transformer模型在GPU上,针对不同的注意力头数量进行推理速度测试,以获得合适推理速度的第一数量;将Transformer模型的注意力头数量设置为第一数量,使用MAE以及蒸馏方法对Transformer模型进行自监督预训练;将自监督训练后的Transformer模型,应用于不同的下游任务,以及进行微调训练;将微调后的模型进行推理速度测试以及精确度测试,以评估模型的性能。本发明能够根据GPU的自身计算特性,针对不同的场景,对模型选择合适的参数,同时利用蒸馏技术和自监督预训练,得到一个轻量级的视觉预训练模型,可广泛应用于图像处理和计算机视觉领域。

    一种家庭能源管理优化方法、装置、电子设备及介质

    公开(公告)号:CN119398380A

    公开(公告)日:2025-02-07

    申请号:CN202411376688.3

    申请日:2024-09-30

    Abstract: 本发明公开了一种家庭能源管理优化方法、装置、电子设备及介质,属于家庭能源管理领域。其中方法包括:对家庭能源管理系统中具有不同电气特性的负载进行建模;根据建立的模型,将家庭能源管理问题转化为马尔可夫决策过程;根据马尔可夫决策过程,利用混合动作空间算法对家庭能源管理系统进行能源的优化调度,以降低家庭能源系统的运行成本与电力消耗;其中混合动作空间算法集成了DQN算法和DDPG算法。本发明通过采用结合DQN与DDPG的MDRL算法,能够处理HEMS中的混合动作空间问题,包括离散和连续动作的组合,具备更高的灵活性和适应性。另外,本发明采用精确离散化动作处理方法,能够解决现有技术中动作空间复杂性升高的问题。

    一种基于Transformer模型的高能效多样化硬件集成计算架构及方法

    公开(公告)号:CN118690788A

    公开(公告)日:2024-09-24

    申请号:CN202410770715.9

    申请日:2024-06-14

    Abstract: 本发明公开了一种基于Transformer模型的高能效多样化硬件集成计算架构及方法,其中硬件集成计算架构包括AI引擎资源和可编程逻辑资源两部分;AI引擎资源中部署有AI引擎专用数据读取内核、AI引擎乘法模块、AIE‑QK乘法模块、AIE‑SV乘法模块、AIE‑FC乘法模块、AIE‑FC2乘法模块、AIE‑FC3乘法模块;可编程逻辑资源中部署有PL前置归一化内核、PL矩阵信息聚合内核、PL‑除法内核、PL‑SoftMax内核、PL前置残差内核、PL后置归一化内核、PL后置残差内核、PL数据写操作内核。本发明的计算架构在Transformer模型推理计算中展现出显著的性能优势,且减少了潜在的兼容性和接口问题,从而提高了系统的稳定性和可靠性,可广泛应用于图像处理技术领域。

    一种面向新型电力系统的常规直流在线潮流反转无功优化方法

    公开(公告)号:CN119675007A

    公开(公告)日:2025-03-21

    申请号:CN202411597664.0

    申请日:2024-11-11

    Abstract: 本发明公开了一种面向新型电力系统的常规直流在线潮流反转无功优化方法,应用于直流输电技术领域,包括:基于在线潮流反转过程中的无功‑电压变化、换流母线无功平衡的无功曲线变化以及常规直流吸收的总无功变化下的状态转换图,确定反转前后的无功‑电压变化强弱,并对状态电压进行限定;根据进入功率循环模式的总有功功率在不同情况下的无功‑电压变化的前三个阶段的电压偏移绝对值大小关系,确定状态电压在普遍情况下的限定,并通过最小调频容量和最大电压偏移限定总有功功率,根据总有功功率确定进入单极运行模式的总有功功率。本发明有效实现了在线潮流过程的无功‑电压稳定,并解决了无功平衡状态转移引起的系统电压越界现象严重的问题。

    用于配电网络状态估计的神经网络嵌入方法、设备及介质

    公开(公告)号:CN119416404A

    公开(公告)日:2025-02-11

    申请号:CN202411343671.8

    申请日:2024-09-25

    Abstract: 本发明公开了一种用于配电网络状态估计的神经网络嵌入方法、装置、电子设备及介质,其中方法包括:获取输入序列;通过时空先验信息嵌入,将时间信息和节点类型信息嵌入到向量中,获得时空嵌入向量;根据最优潮流的功率流动方向对感兴趣的节点进行采样,并融合节点信息,获得节点嵌入向量;使用图同构神经网络捕捉图的局部,将其嵌入到特征向量中,获得结构嵌入向量;将输入序列和三个向量进行融合,并输入图时空预测网络,输出预测结果。本发明通过引入时空先验信息、基于最优潮流方向的图节点嵌入以及图同构神经网络的图结构嵌入,实现了对配电网络特性的建模,弥补了现有技术在配电网络专有建模上的不足,提升了配电网络状态估计的准确性。

    一种基于Transformer模型的高能效多样化硬件集成计算架构及方法

    公开(公告)号:CN118690788B

    公开(公告)日:2025-05-13

    申请号:CN202410770715.9

    申请日:2024-06-14

    Abstract: 本发明公开了一种基于Transformer模型的高能效多样化硬件集成计算架构及方法,其中硬件集成计算架构包括AI引擎资源和可编程逻辑资源两部分;AI引擎资源中部署有AI引擎专用数据读取内核、AI引擎乘法模块、AIE‑QK乘法模块、AIE‑SV乘法模块、AIE‑FC乘法模块、AIE‑FC2乘法模块、AIE‑FC3乘法模块;可编程逻辑资源中部署有PL前置归一化内核、PL矩阵信息聚合内核、PL‑除法内核、PL‑SoftMax内核、PL前置残差内核、PL后置归一化内核、PL后置残差内核、PL数据写操作内核。本发明的计算架构在Transformer模型推理计算中展现出显著的性能优势,且减少了潜在的兼容性和接口问题,从而提高了系统的稳定性和可靠性,可广泛应用于图像处理技术领域。

    一种面向新型电力系统的常规直流在线潮流反转方法

    公开(公告)号:CN119627923A

    公开(公告)日:2025-03-14

    申请号:CN202411514778.4

    申请日:2024-10-29

    Abstract: 本发明公开了一种面向新型电力系统的常规直流在线潮流反转方法,涉及潮流反转技术领域。包括构建常规直流双极结构,对常规直流双极结构生成的直流功率、电压和电流参数变化过程划分为五个阶段,对不同阶段的功率参数进行整定并设置约束条件,利用整定后的参数和约束条件进行常规直流在线潮流反转。本发明能够实现无死区的快速功率控制,充分发挥常规直流下调能力,极大地释放常规直流的柔性调节潜力。

Patent Agency Ranking