-
公开(公告)号:CN119227752A
公开(公告)日:2024-12-31
申请号:CN202411192390.7
申请日:2024-08-28
Applicant: 中国科学院自动化研究所
IPC: G06N3/049 , G06N3/0499 , G06N3/06 , G06N3/084
Abstract: 本发明提供一种嵌入生物网络元结构的多模态脉冲信号识别方法及装置,其中,上述方法包括:获取与待识别多模态信号对应的脉冲序列,其中,脉冲序列包括语音部分与图像部分;将脉冲序列输入至多模态识别模型,得到待识别多模态信号对应的识别结果,其中,将语音部分输入至多模态识别模型的语音输入通道,将图像部分输入至多模态识别模型的图像输入通道;通过多模态识别模型的整合层对语音部分与图像部分进行维度统一与整合,得到整合信号;通过多模态识别模型的隐藏层的生物网络元结构对整合信号进行识别,得到与待识别多模态信号对应的识别结果;通过多模态识别模型的输出层输出识别结果;通过本发明能够提高多模态信号识别的准确率与鲁棒性。
-
公开(公告)号:CN118152528B
公开(公告)日:2024-12-06
申请号:CN202410222968.2
申请日:2024-02-28
Applicant: 中国科学院自动化研究所
IPC: G06F16/332 , G06N3/045 , G06N3/08 , G06F18/214
Abstract: 本发明提供一种基于大语言模型的行动方案生成模型的训练方法及装置,其中方法包括:获取行动方案样本的背景信息,以及初始大语言模型;基于背景信息,以及通用大语言模型,构建行动方案样本的想定数据集;基于想定数据集,以及通用大语言模型,构建行动方案样本的问题数据集;基于问题数据集,以及通用大语言模型,构建行动方案样本的方案数据集;基于问题数据集以及方案数据集,对初始大语言模型进行训练,得到行动方案生成模型。本发明提供的方法,基于连续多阶段的数据集构建,提升了训练数据的全面性、准确性、可定制性。并通过构建得到的数据集对初始大语言模型进行微调训练,提升行动方案生成模型的准确性、可行性、实用性。
-
公开(公告)号:CN112905754B
公开(公告)日:2024-09-06
申请号:CN201911294260.3
申请日:2019-12-16
Applicant: 腾讯科技(深圳)有限公司 , 中国科学院自动化研究所
IPC: G06F16/332 , G06F16/583 , G06N3/045 , G06N3/0499 , G06N3/044
Abstract: 本发明提供了一种基于人工智能的视觉对话方法、装置、电子设备及存储介质;方法包括:获取与图片对应的对话问题及对话历史;将所述图片和所述对话历史中的至少一个确定为通道信息;根据所述对话问题和所述通道信息,进行追踪处理和定位处理中的至少一种处理,得到对应的通道特征;根据所述通道特征,将所述图片、所述对话问题和所述对话历史进行融合处理,得到融合特征;根据所述融合特征进行预测处理,得到所述对话问题对应的对话答案。通过本发明,能够加深对话问题的多模态表示,提升得到的对话答案的准确性,提升视觉对话的精度。
-
公开(公告)号:CN118486447A
公开(公告)日:2024-08-13
申请号:CN202410541444.X
申请日:2024-04-30
Applicant: 中国科学院自动化研究所
IPC: G16H50/20 , G16H40/67 , G06N5/04 , G06N3/0455 , G06N3/098
Abstract: 本发明属于智能医疗技术领域,通过提出以术语抽取模型、术语预测模型和对话模型结合的方式,构建基于术语建模的医疗领域任务型对话系统,然后基于任务型对话系统得到掩码预测模型的输入信息,输入信息包括症状、疾病和症状或疾病的判断结果。基于输入信息结合掩码预测模型,将症状和疾病引入掩码预测模型,统一为一个掩码标记预测任务,效地促进了症状问询和疾病预测两类术语推理任务的联合学习,从疾病状态和标记预测两个角度共同诊断疾病,以进一步提高诊断的准确性并提高了医疗对话诊断的准确性。
-
公开(公告)号:CN118278494A
公开(公告)日:2024-07-02
申请号:CN202410489938.8
申请日:2024-04-23
Applicant: 中国科学院自动化研究所
IPC: G06N3/092 , G06N3/0455 , G06N3/098 , G06N5/04
Abstract: 本发明提供一种用于兵棋推演的可扩展大规模博弈强化学习方法及装置,涉及强化学习技术领域,所述方法包括:构建可扩展的大规模博弈兵棋推演对抗场景;确定强化学习的状态空间、动作空间和奖励构成;基于分组的注意力网络,将联合策略拆分为分组策略,进行博弈对抗中智能体的学习和训练。本发明提供的用于兵棋推演的可扩展大规模博弈强化学习方法及装置,将注意力机制引入多智能体问题中,增强模型在处理长序列观测状态时的学习能力,智能体间的协同关系会通过梯度的优化不断得到强化,最终使得整个协同任务的完成效率达到最大。
-
公开(公告)号:CN118036662A
公开(公告)日:2024-05-14
申请号:CN202311721664.2
申请日:2023-12-14
Applicant: 中国科学院自动化研究所
IPC: G06N3/0455 , G06N3/0464 , G06N3/063 , G06N3/08 , G06V10/42 , G06V10/44 , G06V10/764 , G06V10/80 , G06V10/82
Abstract: 本发明提供一种面向硬件实现的脉冲驱动元脉冲神经网络建立及应用方法,属于计算机视觉技术领域,方法包括:根据待处理图像的视觉任务构建基于卷积的第一脉冲神经网络块、基于卷积的第二脉冲神经网络块、基于Transformer的第一卷积神经网络块、基于Transformer的第二卷积神经网络块、第一下采样模块、第二下采样模块、第三下采样模块、第四下采样模块以及输出层;根据上述组成部分确定脉冲驱动元脉冲神经网络,所述脉冲驱动元脉冲神经网络用于进行视觉任务识别。本发明能够解决现有技术中脉冲神经网络的输出容易出现信息丢失,且在计算机视觉领域精度不高的缺陷。
-
公开(公告)号:CN117876676A
公开(公告)日:2024-04-12
申请号:CN202311821758.7
申请日:2023-12-27
Applicant: 中国科学院自动化研究所
IPC: G06V10/26 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/0464
Abstract: 本发明提供一种脉冲驱动的基于FPN的语义分割系统、方法、电子设备,该系统包括Neck脉冲神经网络模块,用于提取主干网络对输入图像进行下采样过程中得到的不同通道数和不同分辨率下的特征图的特征,还用于将所述不同通道数和不同分辨率下的特征图的通道数调整为相同维度,获得具有相同通道数且不同分辨率的特征图,还用于提取所述具有相同通道数且不同分辨率的特征图的特征;FPN脉冲神经网络模块,用于对所述具有相同通道数且不同分辨率的特征图进行上采样,获得至少一组具有相同通道数和分辨率的特征图,还用于基于所述至少一组具有相同通道数和分辨率的特征图,获得语义分割掩膜,可以实现高精度的语义分割。
-
公开(公告)号:CN116797851B
公开(公告)日:2024-02-13
申请号:CN202310946560.5
申请日:2023-07-28
Applicant: 中国科学院自动化研究所
IPC: G06V10/764 , G06V10/82 , G06V10/44 , G06N3/049 , G06N3/0464
Abstract: 本发明涉及人工智能领域,提供一种图像分类模型的类脑连续学习方法、图像分类方法和装置,学习方法包括:获取初始神经网络、样本图像及其对应的图像类别标签;将输入信号输入至初始神经网络,得到各层神经元输出的图像特征;对图像类别标签进行编码,得到样本图像的期望;并将期望分别映射到各层中,得到各层的局部多巴胺浓度;基于局部多巴胺浓度,对各层的初始局部梯度进行调制,得到各层的调制后局部梯度;基于调制后局部梯度,对初始神经网络的突触连接权重进行更新,以完成类脑连续学习,得到图像分类模型。本发明提供的图像分类模型的类脑连续学习方法、图像分类方法和装置,可以最大程度上保留旧任务信息,同时实现对新任
-
公开(公告)号:CN117315436A
公开(公告)日:2023-12-29
申请号:CN202311220635.8
申请日:2023-09-20
Applicant: 中国科学院自动化研究所
IPC: G06V10/82 , G06V10/764 , G06V10/40 , G06N3/0455 , G06V10/20 , G06V10/80
Abstract: 本发明提供一种全加法脉冲自注意力Transformer的分类方法,包括:获取待分类的图像;基于分类模型的预处理模块,对图像进行特征提取,得到基本特征图,对基本特征图进行相对位置编码,得到位置编码结果;基于分类模型的块混合模块,对位置编码结果进行脉冲序列转化,得到脉冲特征图,并在块维度上对脉冲特征图的第一脉冲矩阵进行脉冲驱动自注意力运算,得到膜电位特征图;基于分类模型的通道混合模块,在通道维度上对膜电位特征图的第二脉冲矩阵进行脉冲驱动自注意力运算,得到输出膜电位;基于分类模型的解码分类模块,应用输出膜电位进行图像分类。本发明提供的方法,可以在降低图像分类处理功耗的同时,保证图像分类处理的准确率。
-
公开(公告)号:CN116645566A
公开(公告)日:2023-08-25
申请号:CN202310899447.6
申请日:2023-07-21
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及图像处理技术领域,提供一种基于全加法脉冲式Transformer的分类方法,包括:获取待分类的图像;基于分类模型的预处理模块,对图像进行特征提取,得到基本特征图,并对基本特征图进行相对位置编码,得到位置编码结果;基于分类模型的编码模块,对位置编码结果进行脉冲序列转化,得到脉冲特征图,并对脉冲特征图的脉冲矩阵进行脉冲驱动注意力运算,得到输出膜电势;基于分类模型的分类模块,应用输出膜电势进行图像分类,得到图像的图像类别。本发明提供的基于全加法脉冲式Transformer的分类方法,可以提高图像分类处理效率、降低处理功耗。
-
-
-
-
-
-
-
-
-