-
公开(公告)号:CN104168485B
公开(公告)日:2017-11-14
申请号:CN201410334839.9
申请日:2014-07-15
Applicant: 清华大学
IPC: H04N19/85 , H04N19/186 , H04N19/146
Abstract: 本发明公开了一种视频图像高速缓存处理方法和装置。该方法包括:预处理步骤,对视频图像划分为若干二维像素块,并将视频图像中各个像素点的亮度信息和色度信息分离;地址转换步骤,将二维像素块内各个像素点的色度信息在主存储单元中的第一地址均转换为第二地址;色度读取步骤,读取色度缓存单元中第二地址对应的色度信息,将二维像素块作为一个像素点进行非精确处理。本发明充分利用了人眼对于视频图像的亮度和色度敏感程度不同的特点,对视频图像中的色度信息采用非精确处理方法,并把这种方法运用在处理器的高速缓存中,降低高速缓存的缺失率。
-
公开(公告)号:CN103955355B
公开(公告)日:2016-12-28
申请号:CN201310086340.6
申请日:2013-03-18
Applicant: 清华大学
IPC: G06F9/38
Abstract: 本发明公开了一种应用于非易失处理器中的分段并行压缩方法及系统,涉及低功耗处理器领域。所述方法包括:S1、确定非易失处理器中分段易失存储单元的状态位应划分的分段数;S2、编写离线/在线混合算法,用离线分段算法对各状态位分段进行压缩仿真得到各分段平均压缩时间相等的划分,以及平均压缩时间和各分段压缩时间标准差;S3、根据状态位分段数和离线分段算法所得到的各分段长度设计非易失处理器;S4、连接各状态位分段与并行压缩单元中的相应压缩模块,用在线控制算法对压缩时间标准差较大的各状态位分段进行动态负载平衡,完成压缩备份。所述系统包括易失处理逻辑单元、分段易失存储单元、并行压缩单元和分段非易失存储单元。
-
公开(公告)号:CN106097265A
公开(公告)日:2016-11-09
申请号:CN201610405989.3
申请日:2016-06-08
Applicant: 清华大学
CPC classification number: G06T5/004 , G06T5/20 , G06T2207/20024
Abstract: 本发明公开了一种高斯滤波装置,所述装置包含一个或多个滤波单元,所述滤波单元包含m×n个输出节点、m×n个中间节点以及m×n个输入节点,其中:m×n路待处理信号分别从m×n个所述输入节点输入,经滤波后分别由m×n个所述输出节点输出m×n路滤波结果信号;输出节点/中间节点间通过第一电阻或第二电阻相连;每个输出节点对应一个中间节点,相对应的输出节点与中间节点间通过第三电阻相连;所述第一电阻与所述第三电阻为正电阻,所述第二电阻为负电阻。与现有技术相比,使用本发明的装置进行高斯滤波处理,不仅大大提高了处理速度,降低了处理能耗,而且提高了处理精度。
-
公开(公告)号:CN106066783A
公开(公告)日:2016-11-02
申请号:CN201610388694.X
申请日:2016-06-02
IPC: G06F7/523
CPC classification number: G06F7/523
Abstract: 本发明提出一种基于幂次权重量化的神经网络前向运算硬件结构,包括:输入缓存模块,输入缓存模块用于缓存从全局存储器中搬运到片上的输入数据和神经网络幂次权重,其中,神经网络幂次权重包括卷积核和全连接矩阵;计算模块,计算模块用于进行基于幂次权重量化的卷积和全连接矩阵向量乘运算;输出缓存模块,输出缓存模块用于缓存计算模块得到的卷积或全连接矩阵向量乘的运算结果;以及控制模块,控制模块用于对输入缓存模块、运算模块和输出缓存模块进行数据搬运和运算资源调度。本发明在有效降低神经网络的存储量的同时,可以有效地降低神经网络运算开销,能够显著提升了神经网络计算系统在终端设备上的应用空间。
-
公开(公告)号:CN105938447A
公开(公告)日:2016-09-14
申请号:CN201610099237.9
申请日:2016-02-23
IPC: G06F11/14
CPC classification number: G06F3/065 , G06F3/061 , G06F3/0619 , G06F3/0665 , G06F3/0688 , G06F11/1441 , G06F11/2015 , G06F11/3037 , G06F12/08 , G06F12/128 , G06F2201/88 , G06F2201/885 , G06F2212/621 , G06F11/1456 , G06F11/1448
Abstract: 本发明提供一种的数据备份装置及方法。该数据备份方法在数据备份装置上电时,统计数据备份装置在上电时刻的顺序访问标识对应的死亡块与生存块的数量,在数据备份装置掉电后,根据所统计的数据备份装置在上电时刻的顺序访问标识对应的死亡块与生存块的数量计算上电时刻的每个顺序访问标识对应的死亡块占每个顺序访问标识对应所采样的缓存块总数的比值,并将所计算的比值与一预设阈值比较,根据比较结果预测易失存储单元中的死亡块,在备份时,不对预测为死亡块的缓存块进行备份,从而减少了数据备份量,提高备份效率。
-
公开(公告)号:CN103077283B
公开(公告)日:2016-05-18
申请号:CN201310016186.5
申请日:2013-01-16
Applicant: 清华大学
IPC: G06F17/50
Abstract: 本发明涉及硬件设计自动化技术领域,具体涉及一种流水线划分、模块并行以及VFI分配优化的且面向ASIC硬件设计的C-to-RTL综合方法。对于硬件设计而言,流水线和并行的结构是提高硬件性能的两个最有效手段,同时在大规模ASIC设计中,VFI的设计可以大幅度降低功耗;而本发明的一种基于VFI优化的C-to-RTL综合方法,通过在C-to-RTL综合过程中,同时对流水线划分、模块并行及VFI分配进行优化;同时,相比于采用三个优化过程分步优化的方法,本发明的方法保证了全局的最优性。因此,本发明增强了C-to-RTL综合技术实用性以及适用范围,为硬件设计提供有力的技术支持。
-
公开(公告)号:CN105469405A
公开(公告)日:2016-04-06
申请号:CN201510845988.6
申请日:2015-11-26
Applicant: 清华大学
IPC: G06T7/00
CPC classification number: G06T2207/10004
Abstract: 本发明提出一种基于视觉测程的同时定位与地图构建方法,包括:采集双目图像并校正,得到无失真的双目图像;对无失真的双目图像进行特征点提取,生成特征点描述子;建立双目图像的特征点匹配关系;根据该匹配关系得到匹配特征点的水平视差,并结合双目图像捕获系统的参数计算空间真实深度;计算当前帧的特征点与世界地图中特征点匹配结果;去除其中错误匹配的特征点,得到成功匹配的特征点;计算成功匹配的特征点在世界坐标系下的坐标与当前参考坐标系下的三维坐标的变换矩阵,根据变换矩阵得到双目图像捕获系统相对初始位置的位姿变化估计值;建立及更新世界地图。本发明具有较低的计算复杂度,厘米级的定位精度及对位置估计的无偏特性。
-
公开(公告)号:CN105447493A
公开(公告)日:2016-03-30
申请号:CN201510868049.3
申请日:2015-12-01
Applicant: 清华大学
IPC: G06K9/46
CPC classification number: G06K9/4609 , G06K9/4614
Abstract: 本发明提出一种基于尺度化缓存插值结构的鲁棒特征点提取系统,包括:积分图计算模块,用于得到积分图数据;特征点定位模块,根据积分图数据得到符合预设条件的特征点的亚像素位置;尺度化缓存插值模块,对积分图数据进行多尺度化缓存和插值;特征点方向计算模块,根据每个特征点的亚像素位置及尺度化缓存插值模块输出的插值结果确定每个特征点的特征方向;特征点描述符向量计算模块,根据特征点的亚像素位置、积分图数据的插值结果和特征点方向,得到特征点描述符向量;单位向量计算模块,对特征点描述符向量进行单位化,以得到预设小数精度的特征点单位向量描述符向量。本发明提高了鲁棒特征点提取算法的计算精度和计算性能,降低了资源占用。
-
公开(公告)号:CN103092573B
公开(公告)日:2016-01-20
申请号:CN201310016195.4
申请日:2013-01-16
Applicant: 清华大学
IPC: G06F9/38
Abstract: 本发明涉及硬件设计自动化技术领域,具体涉及一种流水线划分及模块并行优化的C-to-RTL综合方法。对于硬件设计而言,流水线和并行的结构是提高硬件性能的两个最有效手段;而本发明的一种流水线划分及模块并行优化的C-to-RTL综合方法,通过在C-to-RTL综合过程中,同时对流水线划分及模块并行进行优化,使得在用户给定的系统性能约束条件后,即可得到最优化的流水线划分和模块并行的设计;同时,相比于采用两个优化过程分步优化的方法,本发明的方法保证了全局的最优性。因此,本发明增强了C-to-RTL综合技术实用性以及适用范围,为硬件设计提供有力的技术支持。
-
-
-
-
-
-
-
-
-