基于多模态深度学习的病理分类方法及系统

    公开(公告)号:CN110298383A

    公开(公告)日:2019-10-01

    申请号:CN201910452839.1

    申请日:2019-05-28

    Abstract: 本发明提出一种基于多模态深度学习的病理分类方法及系统,包括:从电子病历中提取出预先选择的属性作为结构化数据的特征表示向量,将特征表示向量平均扩增后再按照预设比例随机丢弃,丢弃的部分被替换为数字0,作为电子病历中结构化数据的病历特征向量;获取与电子病历对应的组织病理学图像,将卷积神经网络的各卷积层的特征图进行全局平均池化后拼接成一维向量,作为组织病理学图像的一种丰富的图像特征向量;将图像特征向量和病历特征向量拼接在一起,得到多模态融合向量,然后将多模态融合向量输入至全连接层,得到二值化的病理分类结果。本发明解决了单模态的特征表示来进行病理良恶性分类的准确率不高的技术问题。

    一种网络远程读写二级存储的系统及方法

    公开(公告)号:CN109117386A

    公开(公告)日:2019-01-01

    申请号:CN201810761324.5

    申请日:2018-07-12

    Abstract: 本发明提供一种网络远程读写二级存储的系统和方法。该系统包括控制模块、内存模块、缓存模块、二级存储设备、系统总线模块和网络接口设备,其中网络接口设备被配置为将接收到的针对二级存储设备的读写请求命令发送至内存模块;缓存模块被配置为存储与写请求相关的接收数据和与读请求相关的待发送数据;二级存储设备被配置为执行内存模块中的二级存储设备命令,经由系统总线模块实现与所述缓存模块的数据交互,以将写请求相关的数据从缓存模块经由系统总线模块转发至二级存储设备或将读请求相关的数据从二级存储设备转发至所述缓存模块。本发明的系统和方法能够提高远程数据读写的效率并降低处理器的负担。

    一种多核处理器、数据同步的方法及装置

    公开(公告)号:CN105094993B

    公开(公告)日:2018-06-19

    申请号:CN201510507602.0

    申请日:2015-08-18

    Inventor: 谭光明 闫洁

    Abstract: 本发明公开了一种多核处理器,包括:物理锁装置和集成在每个处理器核上的虚拟锁指令执行装置,物理锁装置分别与每个虚拟锁指令执行装置连接,物理锁装置包括多个物理锁,用于存储数据对象的内存空间包括多个虚拟锁的标识,虚拟锁的标识为数据对象的一个存储地址,且虚拟锁的标识的数量大于物理锁的标识的数量;虚拟锁指令执行装置用于根据目的虚拟锁的标识映射出目的物理锁的标识,物理锁装置用于根据目的物理锁的标识,从多个物理锁中确定目的物理锁;对目的物理锁执行锁操作类型标识对应的锁操作,得到针对目标物理锁的锁操作结果。本发明实施例提供的多核处理器,可以解决线程间的对数据对象的访问冲突问题,又避免了物理锁的内存开销。

    代码生成器的自动调优方法、装置、存储介质、程序产品

    公开(公告)号:CN119783775A

    公开(公告)日:2025-04-08

    申请号:CN202411818719.6

    申请日:2024-12-11

    Abstract: 本发明提出一种代码生成器的自动调优方法、装置、存储介质、程序产品,该方法包含:依据给定的大模型推理芯片的特性定义搜索空间,将给定的搜索算法集成到所述大模型推理芯片的软件开发环境中,并利用给定的搜索算法,经过多轮循环,生成参数列表种群,所述参数列表种群包含若干参数列表;根据所述参数列表种群配置具体模板参数,生成核函数的定义部分、流水缓冲级以及结果寄存器转存到全局内存的过程;通过编译器编译生成的核函数,并在所述大模型推理芯片上执行,对生成的所述核函数进行性能测量,获取核函数性能指标,并将所述参数列表种群和对应的核函数性能指标作为键值对加入到所述性能字典中。

    面向多核并行体系结构的卷积算子编译优化方法及装置

    公开(公告)号:CN119759357A

    公开(公告)日:2025-04-04

    申请号:CN202411825773.3

    申请日:2024-12-12

    Abstract: 本发明提出一种面向多核并行体系结构的卷积算子编译优化方法和装置。包括:输入转换器模块提取和去重模型中的或者用户输入的卷积参数,并生成卷积描述符组;控制器模块根据历史记录决定是否对输入模块启动调优,将需要调优的卷积描述符传递给调优器模块;调优器模块负责根据配置好的参数空间进行算子的自动调优,输出最佳参数配置;代码生成模块根据接收到的调优参数组合及卷积描述符生成HIP代码,并分别对各个参数生成的核函数进行对应编号。核函数执行模块编译和执行已生成的代码,并通过测试框架对各个核函数的性能进行测试,按编号返回对应的适应度信息并汇总为列表返回给调优器模块。

    深度学习作业优先级调度方法及深度学习作业系统

    公开(公告)号:CN113568725B

    公开(公告)日:2024-11-22

    申请号:CN202110794626.4

    申请日:2021-07-14

    Abstract: 本发明提出一种深度学习作业优先级调度方法,包括:于任一作业调度周期内,获取GPU集群中所有可用GPU的预测工作参数,以及该GPU集群的等待队列中所有作业的预测作业参数;以该预测工作参数和该预测作业参数预估每个作业的剩余执行时间;以任一作业的剩余执行时间与该作业的预估资源数量的乘积,作为该作业的作业面积;选取所有作业中具有作业面积最小值的作业,设置具有当前作业周期内的最高优先级。本发明还提出一种深度学习作业系统,以及一种数据处理装置。

    一种用于稀疏矩阵向量乘设计的神经网络模型

    公开(公告)号:CN118734905A

    公开(公告)日:2024-10-01

    申请号:CN202410876281.0

    申请日:2024-07-02

    Abstract: 本发明提供了一种用于稀疏矩阵向量乘设计的神经网络模型,用于为稀疏矩阵向量乘程序设计相关的多个决策阶段分别提供用于决策的策略和价值,所述神经网络包括:特征提取器,用于从稀疏矩阵在前一阶段的阶段表达中提取阶段特征,所述阶段表达包括层次映射、非零元的绝对位置和相对位置,所述层次映射指示稀疏矩阵的非零元在计算硬件中的分配信息;策略网络,用于根据所述阶段特征确定当前阶段的策略,所述策略为预测的当前阶段采取各动作的概率。价值网络,用于根据所述阶段特征确定价值,所述价值为前一阶段的阶段表达对应状态的期望价值。

Patent Agency Ranking