-
公开(公告)号:CN118733944A
公开(公告)日:2024-10-01
申请号:CN202410876067.5
申请日:2024-07-02
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种基于强化学习的稀疏矩阵向量乘的程序设计系统,包括:稀疏矩阵表达模块,被配置为:在多个决策阶段中的每个阶段,确定稀疏矩阵对应的阶段表达,各阶段表达包括用于指示稀疏矩阵在当前阶段在计算硬件的层次计算资源中分配信息的层次映射、非零元的绝对位置和相对位置;强化学习模块,被配置为:在第i阶段,利用神经网络从第i‑1阶段的阶段表达中提取阶段特征,根据阶段特征确定第i阶段的策略和预测价值;获取基于蒙特卡洛树搜索算法为该稀疏矩阵维护的搜索树,并基于搜索树、策略和预测价值,确定第i阶段采取的动作;根据所有阶段采取的动作,构建引导稀疏矩阵向量乘在计算硬件上完成计算的程序代码。
-
公开(公告)号:CN114546638A
公开(公告)日:2022-05-27
申请号:CN202210100983.0
申请日:2022-01-27
Applicant: 中国科学院计算技术研究所
IPC: G06F9/50 , G06F9/54 , G06F16/11 , G06F16/172 , G06F16/182 , G06F16/29 , G06Q10/04 , G06Q50/26
Abstract: 本发明提出一种基于高性能并行优化的海洋数据同化方法和系统,包括:获取待同化的海洋数据与数学模型,根据海洋数据中背景场数据和海洋格点分布图,分别计算每个海洋格点的数据同化复杂度,生成基于数据同化复杂度的计算拓扑图;根据预设的经度范围,将海洋格点分布图中格点进行分组,并根据计算拓扑图,统计每个组对应的整体同化复杂度,以为各组均衡分配多个计算节点,并将各计算节点负责的计算量均衡划分给计算节点内的计算进程;计算节点内的计算进程完成各自的数据同化任务后,得到同化结果数据,并将同化结果数据写回数学模型,作为海洋数据同化结果。本发明以计算拓扑图为负载均衡划分的依据,实现分布式计算系统中各进程的负载均衡。
-
公开(公告)号:CN116645733A
公开(公告)日:2023-08-25
申请号:CN202310458727.3
申请日:2023-04-25
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于深度伪造检测的深度学习模型推理加速方法、装置,所述方法包括:获取待检测图像视频;优化深度学习模型;基于优化后的所述深度学习模型,识别所述待检测图像视频的人脸特征;以及依据所述人脸特征,判断所述图像视频是否为深度伪造文件。该方法降低了模型推理预测时间,提升了深度伪造图像视频的检测性能。
-
公开(公告)号:CN118733945A
公开(公告)日:2024-10-01
申请号:CN202410876221.9
申请日:2024-07-02
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种稀疏矩阵向量乘空间表达的方法,包括:按照预定格式构建稀疏矩阵的状态空间,包括:获取待计算的稀疏矩阵向量乘中所需的稀疏矩阵;在多个决策阶段中的每个阶段,分别确定稀疏矩阵对应的阶段表达,其包括层次映射、非零元的绝对位置和相对位置,所述层次映射指示稀疏矩阵的非零元在计算硬件中的分配信息;借助本发明方法所提的阶段表达,对稀疏矩阵的稀疏存储格式和内核优化的过程进行统一表达,以在后续内核优化的过程中考虑之前内核优化的过程对稀疏存储格式的影响,从而有助于提升设计的稀疏矩阵向量乘程序的性能。
-
公开(公告)号:CN118734905A
公开(公告)日:2024-10-01
申请号:CN202410876281.0
申请日:2024-07-02
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种用于稀疏矩阵向量乘设计的神经网络模型,用于为稀疏矩阵向量乘程序设计相关的多个决策阶段分别提供用于决策的策略和价值,所述神经网络包括:特征提取器,用于从稀疏矩阵在前一阶段的阶段表达中提取阶段特征,所述阶段表达包括层次映射、非零元的绝对位置和相对位置,所述层次映射指示稀疏矩阵的非零元在计算硬件中的分配信息;策略网络,用于根据所述阶段特征确定当前阶段的策略,所述策略为预测的当前阶段采取各动作的概率。价值网络,用于根据所述阶段特征确定价值,所述价值为前一阶段的阶段表达对应状态的期望价值。
-
公开(公告)号:CN115359316A
公开(公告)日:2022-11-18
申请号:CN202210984120.4
申请日:2022-08-17
Applicant: 中国科学院计算技术研究所
IPC: G06V10/774 , G06V10/40 , G06V10/764
Abstract: 本发明提供一种基于增量学习的图像分类模型训练方法,所述图像分类模型包括特征提取网络和分类器,所述方法包括对图像分类模型进行多阶段训练直至图像分类模型的准确率达到预设准确率要求,每个阶段训练后获得一个该阶段对应的图像分类模型,每个阶段使用不同类别的图像数据集,每个图像数据集中包含多个图像以及图像对应的分类标签,其中,每阶段训练包括:S1、以上一阶段训练后的图像分类模型的特征提取网络的参数,初始化本阶段训练的图像分类模型对应的特征提取网络;S2、采用本阶段的图像数据集将经步骤S1初始化特征提取网络后的图像分类模型训练至收敛。本发明能够有效抑制灾难性遗忘以及小样本过拟合问题。
-
-
-
-
-