一种基于哈希映射的低条目数一致性目录及其使用方法

    公开(公告)号:CN118708503A

    公开(公告)日:2024-09-27

    申请号:CN202410701915.9

    申请日:2024-05-31

    Applicant: 复旦大学

    Abstract: 本发明属于多核处理器技术领域,具体为一种基于哈希映射的低条目数一致性目录及其使用方法。本发明的一致性目录为一个两维网格阵列;每个网格代表一个目录条目;目录阵列中,对应于每一路(列),分别设置一个哈希函数;各个哈希函数相互独立,哈希函数将输入地址映射至目录的各个路中,输入地址在每一路中只能映射到一个条目;目录阵列中条目分为多种类型,包括TE类型、TS类型、SV类型等;当缓存块处于私有状态时只需单个条目记录缓存块的标签与独占者信息;当缓存块被多个核心共享时需要两个条目分别记录标签信息和共享者信息,且两个条目通过位置指针相关联。本发明可以有效减少稀疏目录所需条目数量和单个条目长度,且具有很好的扩展性。

    一种基于近内存处理架构的推荐模型推理加速系统

    公开(公告)号:CN118550697A

    公开(公告)日:2024-08-27

    申请号:CN202410621425.8

    申请日:2024-05-20

    Applicant: 复旦大学

    Abstract: 本发明属于推荐系统模型技术领域,具体为一种基于近内存处理架构的推荐模型推理加速系统。本发明包括硬件和软件两大部分,硬件部分为位于缓冲芯片中的近内存处理单元的架构,包括:DDR内存的缓冲芯片内部的近内存端的位于DIMM层面的DIMM级处理单元(DPE)、位于Rank层面的Rank级处理单元(RPE);近内存端处理单元使用的自定义压缩指令集;Bank‑Group扩展级;软件部分包括嵌入表的划分模块、主机端需要执行的算法模块、主机端的软件架构等。本发明在近内存处理架构中支持多种划分策略同时存在,并为推荐模型的每张嵌入表选择最优的划分策略,以达到针对推荐模型推理的加速效果。

    保持对比度的近红外与大噪声可见光图像融合方法

    公开(公告)号:CN116934641A

    公开(公告)日:2023-10-24

    申请号:CN202310743905.7

    申请日:2023-06-24

    Abstract: 本发明属于图像处理技术领域,具体为保持对比度的近红外与大噪声可见光图像融合方法。本发明包括:在图像融合之前对含噪可见光图像进行预去噪处理;在图像融合过程中,首先生成一副对比度与NIR相似且外观与VIS相似的低频图像,并再次去噪,作为融合后的基础层;然后分别从VIS和NIR中提取高频分量;根据局部对比度生成融合权重图,自适应地将VIS和NIR的高频分量加权融合,作为融合后的细节层;最后将细节层加至基础层上,转换到显示所需的色彩空间,得到最终图像融合结果。本发明对每个像素的处理只用到局部邻域内的像素,无需获取全局信息,无需迭代求解,有利于硬件实现和实时处理,生成的图像内容准确、细节丰富。

    针对图像拼接的匹配点获取方法

    公开(公告)号:CN112258561B

    公开(公告)日:2023-08-25

    申请号:CN201910659410.X

    申请日:2019-07-22

    Applicant: 复旦大学

    Abstract: 本发明提供一种针对图像拼接的匹配点获取方法,用于在可检测特征不明显的情况下获取足够多的匹配点来完成图像拼接,其特征在于,包括如下步骤:步骤S1,获取待拼接的两张图像作为待拼接图像;步骤S2,将待拼接图像输入预设的卷积神经网络模型从而获取分别对应两张待拼接图像的特征图;步骤S3,利用预先建立的计算模型,并通过预定位方法以及细定位方法获取分别对应两张待拼接图像的特征图之间的匹配点;步骤S4,根据预先建立的定位模型将匹配点从特征图映射到待拼接图像中形成图像匹配点;步骤S5,根据图像匹配点完成待拼接图像的拼接。

    一种无cache一致性协议的分布式共享片上存储架构

    公开(公告)号:CN105183662B

    公开(公告)日:2017-12-29

    申请号:CN201510457104.X

    申请日:2015-07-30

    Applicant: 复旦大学

    CPC classification number: Y02D10/13

    Abstract: 本发明属于处理器技术领域,具体为一种无cache一致性协议的分布式共享片上存储架构。本发明基于簇状结构,将cache只映射本地的主存空间,处理器通过访问其它核的cache来完成对簇内其它共享主存块的读写,这样,由于不同核cache之间不再映射重叠的主存地址空间,因而取消了所谓多核处理器的cache一致性问题;本地核L1存储器一分为二:非缓存的存储器+cache,降低cache缺失率,避免了相应的复杂逻辑电路以及功耗开销。而且支持直接存储访问操作:在流应用中支持DMA直接对主存进行簇间大块数据搬移,适用于规模的拓展性。

    一种无cache一致性协议的分布式共享片上存储架构

    公开(公告)号:CN105183662A

    公开(公告)日:2015-12-23

    申请号:CN201510457104.X

    申请日:2015-07-30

    Applicant: 复旦大学

    CPC classification number: Y02D10/13

    Abstract: 本发明属于处理器技术领域,具体为一种无cache一致性协议的分布式共享片上存储架构。本发明基于簇状结构,将cache只映射本地的主存空间,处理器通过访问其它核的cache来完成对簇内其它共享主存块的读写,这样,由于不同核cache之间不再映射重叠的主存地址空间,因而取消了所谓多核处理器的cache一致性问题;本地核L1存储器一分为二:非缓存的存储器+ cache,降低cache缺失率,避免了相应的复杂逻辑电路以及功耗开销。而且支持直接存储访问操作:在流应用中支持DMA直接对主存进行簇间大块数据搬移,适用于规模的拓展性。

    一种解决可满足性问题的正交化算法

    公开(公告)号:CN101295328A

    公开(公告)日:2008-10-29

    申请号:CN200810039209.3

    申请日:2008-06-19

    Applicant: 复旦大学

    Abstract: 本发明属于超大规模集成电路的形式验证技术领域,具体为一种解决SAT问题的正交化算法。该算法首先定义了子句之间的正交关系,然后,从消除子句之间的交叠信息出发,利用正交子句的特性,结合有效的简化技术,逐渐将问题简化为一组与原问题完全等价的正交子句组;最后,根据正交子句组对整个赋值空间的覆盖情况来判断SAT是否满足。本发明方法高效实用,能够加速问题的简化过程,提高解题的运算速度,可适用于超大规模集成电路设计中自动测试向量生成、时序分析、逻辑验证、等价验证等。

Patent Agency Ranking