-
公开(公告)号:CN114943338A
公开(公告)日:2022-08-26
申请号:CN202210266429.X
申请日:2022-03-17
Abstract: 本发明公开了一种基于访问模式和熵感知的ReRAM推荐系统加速器映射方法及系统,本发明在推荐系统映射之前,对推荐系统负载的数据集进行访问模式的采样分析,充分利用嵌入表的访问模式来聚类嵌入向量,利用嵌入表的熵值来对映射在ReRAM加速器上的嵌入表进行混合量化,使得ReRAM加速器在有限的交叉阵列资源上执行推荐系统模型,解决内存瓶颈问题,从而加速整个推理过程并降低推理能耗。
-
公开(公告)号:CN117521749A
公开(公告)日:2024-02-06
申请号:CN202311355813.8
申请日:2023-10-19
Applicant: 浙江大学
Abstract: 本发明提供了一种基于忆阻器的推荐系统加速器的嵌入查询推理方法,对于输入的一个批次的样本数据batch0,基于嵌入表,分别分析一个批次的样本数据中对应索引元素的冗余现象,去除重复的索引元素,得到新的无冗余样本数据batch1;并建立batch0和batch1之间的映射;基于无冗余样本数据batch1访问存储器进行嵌入表查询和推理,推理完成后,根据原始的样本数据batch0和无冗余样本数据batch1之间的映射,对推理结果进行复制填充至原始的样本数据batch0对应大小,获得最终的原始的样本数据batch0对应的推理结果。本发明通过对输入的样本数据进行分析,去除其中重复的查询索引,构建新的无冗余数据来进行推理,减少了冗余的忆阻器访问,从而提升系统整体的推理性能。
-