基于轻量化Transformer网络的语音识别系统及方法

    公开(公告)号:CN116013309B

    公开(公告)日:2025-03-21

    申请号:CN202310065728.1

    申请日:2023-01-14

    Applicant: 西南大学

    Abstract: 本发明涉及人工智能领域中的语音识别技术,具体公开了一种基于轻量化Transformer网络的语音识别系统及方法,系统包括预处理模块、第一前向传播模块、多头注意力模块、卷积模块、第二前向传播模块和全连接层模块,该系统通过模块化硬件设计且将部分参数利用忆阻交叉阵列予以实现,不仅具有较轻的网络模型,而且在不同的硬件规模下具有良好的识别精度,能有效地减少电路的能耗和面积开销,可以在功耗低、结构轻的边缘设备上实现语音识别任务,并具有较好的稳定性和抗噪性。

    一种基于忆阻器的文本情感检测系统及方法

    公开(公告)号:CN115994221A

    公开(公告)日:2023-04-21

    申请号:CN202310091466.6

    申请日:2023-02-06

    Applicant: 西南大学

    Abstract: 本发明涉及文本情感识别技术领域,具体公开了一种基于忆阻器的文本情感检测系统及方法,该系统包括预处理模块、注意力计算模块和情感分类模块。本系统中的线性映射和矩阵乘法操作采用忆阻交叉阵列构建,而其余电路模块也采用CMOS技术组建。与传统的计算架构(GPU)相比,本发明所设计的硬件方案具有更低的功耗,同时减少了因内存和计算单元分离而造成的额外电路面积开销;本发明提出了名为MLA‑DSCN的轻量级网络模型来实现文本情感检测任务,通过将深度分离卷积模块融合到网络中,改进后的网络模型MLA‑DSCN不仅可以关注输入文本信息的全局信息,还可以提高其在局部层面的信息提取能力,在不牺牲精度的前提下,将网络参数的数量降低了3倍。

    一种基于离散小波变换的图像复原方法及设备

    公开(公告)号:CN117422624A

    公开(公告)日:2024-01-19

    申请号:CN202311448794.3

    申请日:2023-11-02

    Applicant: 西南大学

    Abstract: 本发明涉及图像复原技术领域,具体公开了一种基于离散小波变换的图像复原方法和设备,设计了图像复原网络,称为多小波注意记忆神经网络(MWA‑MNN),它由三个子网络组成,子网络中包括离散小波注意块(DWAB)和坐标通道注意块(CCAB)来提取空间和通道特征信息,从而有效地将雨纹等退化图像层从图像中分离出来干净的图像,利用小波变换对高频信息的表现力,从而提高图像的复原性能。子网络中还包括监督选择性核块(SSKB),用于过滤每个子网络中有效提取的特征。本发明还提出了一种基于忆阻器交叉阵列MWA‑MNN电路实现方案,忆阻器是一种新型的非易失性存储器类型,具有更快的读取速度和更低的功耗。实验结果表明,该方法在各种图像复原任务中具有良好的性能和通用性。

    一种基于类脑视觉Transformer的图像修复方法及ADAS边缘设备

    公开(公告)号:CN117392020A

    公开(公告)日:2024-01-12

    申请号:CN202311466352.1

    申请日:2023-11-07

    Applicant: 西南大学

    Abstract: 本发明涉及图像修复技术领域,具体公开了一种基于类脑视觉Transformer的图像修复方法及ADAS边缘设备,创建了一种U型结构的图像修复网络(LSFormer),在该网络中,提出了线性稀疏Transformer块(LSTB),在LSTB中设计了聚焦线性稀疏注意力块(FLSA)降低计算复杂性,有助于减轻与Softmax相关的异常值问题;在FLSA中还设计了多尺度前馈网络(MSFF),以通过使用不同深度卷积核大小来增强局部表示;在LSFormer还提出了小波注意力块(WAB),来改进输出图像。此外,本发明提供了基于忆阻器类脑计算系统的硬件实施方案,用于智能车辆中应用ADAS。本发明还评估了提出的网络在多个数据集上的性能,包括低照度增强、图像去雨和图像去雾等任务,结果表明,LSFormer在这三个任务中均优于最先进的网络。

    一种基于类脑视觉Transformer的图像修复方法及ADAS边缘设备

    公开(公告)号:CN117392020B

    公开(公告)日:2025-03-04

    申请号:CN202311466352.1

    申请日:2023-11-07

    Applicant: 西南大学

    Abstract: 本发明涉及图像修复技术领域,具体公开了一种基于类脑视觉Transformer的图像修复方法及ADAS边缘设备,创建了一种U型结构的图像修复网络(LSFormer),在该网络中,提出了线性稀疏Transformer块(LSTB),在LSTB中设计了聚焦线性稀疏注意力块(FLSA)降低计算复杂性,有助于减轻与Softmax相关的异常值问题;在FLSA中还设计了多尺度前馈网络(MSFF),以通过使用不同深度卷积核大小来增强局部表示;在LSFormer还提出了小波注意力块(WAB),来改进输出图像。此外,本发明提供了基于忆阻器类脑计算系统的硬件实施方案,用于智能车辆中应用ADAS。本发明还评估了提出的网络在多个数据集上的性能,包括低照度增强、图像去雨和图像去雾等任务,结果表明,LSFormer在这三个任务中均优于最先进的网络。

    基于轻量化Transformer网络的语音识别系统及方法

    公开(公告)号:CN116013309A

    公开(公告)日:2023-04-25

    申请号:CN202310065728.1

    申请日:2023-01-14

    Applicant: 西南大学

    Abstract: 本发明涉及人工智能领域中的语音识别技术,具体公开了一种基于轻量化Transformer网络的语音识别系统及方法,系统包括预处理模块、第一前向传播模块、多头注意力模块、卷积模块、第二前向传播模块和全连接层模块,该系统通过模块化硬件设计且将部分参数利用忆阻交叉阵列予以实现,不仅具有较轻的网络模型,而且在不同的硬件规模下具有良好的识别精度,能有效地减少电路的能耗和面积开销,可以在功耗低、结构轻的边缘设备上实现语音识别任务,并具有较好的稳定性和抗噪性。

Patent Agency Ranking