一种面向多边缘设备的Transformer模型协同推理方法

    公开(公告)号:CN118839766A

    公开(公告)日:2024-10-25

    申请号:CN202410844642.3

    申请日:2024-06-27

    Abstract: 本发明公开的一种面向多边缘设备的Transformer模型协同推理方法,属于边缘计算领域。本发明实现方法为:将原数据集划分为多个标签类别数相等的子数据集,根据边缘设备计算性能和资源,切分原始模型为多个仅保留重要结构的子模型,通过子任务蒸馏方法帮助子模型学习原始模型特征,采用模型集成方法聚合所有子模型,提升集成模型的整体性能;将训练好的集成模型中的子模型,分别部署到对应边缘设备上。当边缘设备接收的推理任务请求时,所有边缘设备并行执行子模型的推理,中心节点使用特征融合模块融合所有中间结果得到最终推理结果,实现多边缘设备的模型协同推理,提高边缘设备执行推理任务的推理速度,降低边缘设备执行推理任务的推理能耗。

    一种用于资源受限异构设备的神经网络协同推理方法

    公开(公告)号:CN118839767A

    公开(公告)日:2024-10-25

    申请号:CN202410844731.8

    申请日:2024-06-27

    Abstract: 本发明公开的一种用于资源受限异构设备的神经网络协同推理方法,属于边缘计算领域。本发明实现方法为:构建针对资源受限异构设备的推理时延预测器,采用贝叶斯优化拆分方法,拆分需要部署推理的原始神经网络模型得到多个适配资源受限异构设备计算性能和硬件资源约束的子模型;使用渐进增强蒸馏方法依次训练所有子模型,将训练好的所有子模型部署到对应的资源受限异构设备上,当接收到推理任务请求时,联合多个空闲的资源受限异构设备并行执行子模型的计算,计算结果通过资源受限设备间的局域网传输到中心节点进行汇聚后得到最终推理结果,节省多资源受限异构设备的计算开销和存储资源,降低多资源受限异构设备的推理时延和能量损耗。

    一种用于多接入边缘计算系统的神经网络协同推理方法

    公开(公告)号:CN114723057A

    公开(公告)日:2022-07-08

    申请号:CN202210342808.2

    申请日:2022-03-31

    Abstract: 本发明公开的一种用于多接入边缘计算系统的神经网络协同推理方法,属于边缘计算领域。本发明针对多接入边缘计算系统中接入设备计算资源及电源能量受限,难以仅靠自身完成复杂模型推理的问题,通过设计一种将神经网络模型切分并分别放在本地和服务器执行的协同推理方法,使用轻量自编码器并利用量化技术压缩中间特征,减少需要通过无线信道传输的数据量,并使用深度强化学习方法为每个接入设备提供模型切分策略、无线信道选择策略及发射功率设定策略,在有限信道资源下充分利用边缘服务器协助接入设备完成推理任务。本发明能够有效降低各接入设备的平均推理时延和能耗,为基于复杂模型的智能应用在移动设备上的部署提供支撑。

    一种用于边缘设备的神经网络动态早退加速推理方法

    公开(公告)号:CN116776982A

    公开(公告)日:2023-09-19

    申请号:CN202310808099.7

    申请日:2023-07-03

    Abstract: 本发明公开的一种用于边缘设备的神经网络动态早退加速推理方法,属于边缘计算领域。使用异构退出头结构,提高模型的特征提取能力,实现更高的模型精度、更快的推理速度和更低的模型运算复杂度;使用两阶段训练策略训练基于异构退出头的动态早退模型,更充分地发挥退出头的潜能,进一步提高模型精度,降低模型运算复杂度;使用动态推理方法,动态执行部分网络,节省计算资源;同时根据输入数据的复杂性动态选择模型输出路径,以适应不同场景,实现精度‑效率之间的权衡。本发明适用于边缘计算领域,提高模型精度,加快推理速度并且降低模型运算复杂度,为基于复杂模型的智能应用在边缘设备的部署提供支撑。

    一种基于多层次匹配和预训练语言模型的法条推荐方法

    公开(公告)号:CN118427306A

    公开(公告)日:2024-08-02

    申请号:CN202410621333.X

    申请日:2024-05-20

    Abstract: 本发明一种基于多层次匹配和预训练语言模型的法条推荐方法,属于自然语言处理领域。本发明使用BERT模型最后一层输出的向量经过BiLSTM提取上下文信息得到句级特征。利用法条对应的罪名特征和司法解释使用TF‑IDF技术对每一条法条提取关键词,利用交互注意力机制将法条关键词分别融入到事实和法条的文本向量中,采用最大池化保留最关键的特征得到关键词级别特征。利用BERT+CRF提取犯罪四要件,通过交互注意力机制将犯罪四要件分别融入到事实和法条的文本向量中,采用最大池化保留最关键特征得到犯罪四要件级别特征。综合句级、关键词级别、犯罪四要件特征多层次衡量事实与法条的相关性。本发明能实现法条多层次精准匹配推荐,辅助提高法条推荐任务的精度和效率。

    一种用于卫星的集成模型无数据压缩方法

    公开(公告)号:CN114897155A

    公开(公告)日:2022-08-12

    申请号:CN202210328123.2

    申请日:2022-03-30

    Abstract: 本发明公开的一种用于卫星的集成模型无数据压缩方法,属于卫星通信深度学习领域。针对在卫星上部署神经网络模型需要消耗大量存储及计算资源,且原始训练数据无法获取的问题,本发明通过建立极小‑极大优化目标训练一个生成器模型合成替代数据,并使用生成数据将卫星端的多个历史版本模型压缩为一个具有多分支结构的轻量模型;然后使用卫星端更新模型时的少量标注数据,训练注意力模型动态聚合各分支预测结果。本发明以无需数据的形式将卫星端模型更新过程中产生的多个历史版本模型压缩,以较小的精度损失为代价,大幅度减少模型所需的存储空间及浮点运算次数,节约卫星上宝贵的存储及计算资源。

    一种基于双曲图卷积网络和层次聚类的主题分类方法

    公开(公告)号:CN118673928A

    公开(公告)日:2024-09-20

    申请号:CN202410639670.1

    申请日:2024-05-22

    Abstract: 本发明公开的一种基于双曲图卷积网络和层次聚类的主题分类方法,属于自然语言处理中的文本主题分类技术领域。本发明实现方法为:对微博文本数据进行预处理,包括数据清洗、中文分词和去除停用词;使用TF‑IDF方法计算特征向量。将预处理后的文本数据映射到双曲空间,利用指数映射和对数映射在欧氏空间与双曲空间之间转换信息,同时保留双曲空间的层次结构特征。计算节点间的双曲距离并结合层次聚类算法,捕捉层次结构数据中的关系。相似或相关的节点能够在双曲图卷积网络的信息聚合过程中获得更高的权重,挖掘文本数据的层次结构,通过训练双曲图卷积神经网络捕捉微博文本数据的层次结构关系,利用训练好的双曲图卷积神经网络实现高质量的主题分类。

    一种基于Bert多层信息融合与双曲神经网络的情感分类方法

    公开(公告)号:CN118607530A

    公开(公告)日:2024-09-06

    申请号:CN202410639788.4

    申请日:2024-05-22

    Abstract: 本发明公开的一种基于Bert多层信息融合与双曲神经网络的情感分类方法,属于自然语言处理中的文本情感分析技术领域。本发明实现方法为:将预处理后的微博文本数据输入Bert嵌入层进行词嵌入,转变成向量的形式。将文本向量进入Bert多层信息特征提取层进行特征提取,进一步挖掘语义信息,通过注意力机制来将Bert中各个隐藏层中的CLS向量进行融合,将融合后的特征向量输入到双曲空间中挖掘深层层次信息,在双曲空间中完成特征聚合,实现高质量的情感分类。本发明特别适用于处理社会舆论网络等复杂网络的情感分类和公共舆论监控,解决传统方法在高维、非欧几里得结构数据空间中的分类难题,提高对网络数据中微博文本的表示和分类能力。

Patent Agency Ranking