基于动态树形门控网络的模块化持续学习方法

    公开(公告)号:CN118153665A

    公开(公告)日:2024-06-07

    申请号:CN202410296455.6

    申请日:2024-03-15

    Abstract: 本发明公开了一种基于动态树门控网络的高效模块化持续学习方法,主要解决现有技术计算资源浪费,模块复用率低及灾难性遗忘的问题。其实现方案是:1)获取任务流训练集;2)设计包含功能组件及树形门控组件的模型网络并定义其损失函数;3)将任务流训练集输入到模型网络中对其进行训练:3a)利用树形门控组件和功能组件产生模块的任务特征,将若干模块求和得到模型网络的输出;3b)计算模型网络损失函数和梯度,更新模型网络参数;3c)单一任务训练结束后,冻结模型网络参数;重复3a)‑3c)直至任务流训练集结束,获得训练好的模型网络。本发明能克服灾难性遗忘,提升模块复用率,节约计算资源,可用于机器人学习,医疗诊断与辅助治疗。

    基于提示增强和稀疏注意力的视频问答方法

    公开(公告)号:CN117649628A

    公开(公告)日:2024-03-05

    申请号:CN202311681462.X

    申请日:2023-12-08

    Abstract: 本发明公开了基于提示增强和稀疏注意力的视频问答方法,包括以下步骤;步骤1:使用预训练CLIP模型进行特征提取和提示构建;步骤2:输入步骤1提取的特征,构建概率稀疏自注意力PSSA提取视频关键特征;步骤3:通过步骤2提取的视频关键特征,融合视频特征与文本提示,通过融合特征与候选答案特征的相似度判断答案。本发明利用预训练的CLIP模型的强大的视觉文本泛化能力,以解决视频文本预训练的成本问题。通过充分利用CLIP对比学习的特性,考虑概率稀疏自注意力和视觉语言交叉注意力,以有效地消除视频特征中的冗余信息。

    基于稳态视觉诱发电位的连续单词拼写方法

    公开(公告)号:CN115480640A

    公开(公告)日:2022-12-16

    申请号:CN202211150854.9

    申请日:2022-09-21

    Abstract: 本发明公开了一种基于稳态视觉诱发电位的连续单词拼写方法,主要解决现有技术中特征提取效率低、拼写不连续的问题。其实现方案为:使用联合频率相位调制范式对刺激界面中所有字符编码;使用者注视刺激界面中的字符,诱发稳态视觉诱发电位,获得训练信号和测试信号;利用训练信号获取重构模板信号的模型参数;截取测试信号中所有注视阶段的稳态视觉诱发电位信号;利用模板信号对所有注视阶段的稳态视觉诱发电位信号片段进行特征提取和识别;将识别结果中的字符序列组合成单词,完成连续的单词拼写输入。本发明提高了稳态视觉诱发电位信号的特征提取效率和识别准确率,提升了拼写的连续性和信息传输率,可用于人机交互过程中的单词拼写。

    基于空间划分的SLAM快速回环检测方法

    公开(公告)号:CN113899361A

    公开(公告)日:2022-01-07

    申请号:CN202111502704.5

    申请日:2021-12-10

    Abstract: 本发明公开了基于空间划分的SLAM快速回环检测方法,其包括通过无人机机载传感器获取待测场景的图像序列、IMU测量值和GPS测量值,并通过LK光流法和预积分方法计算得到两组对应的无人机的位置和姿态;根据待测场景的GPS位置坐标,通过八叉树模型对待测场景进行空间划分及编码;对图像序列中的图像进行空间编码比对和筛选,并对筛选的图像进行哈希编码,检测图像间是否存在回环;将回环检测结果即图像间的回环关系与计算的两组无人机位姿进行融合,得到全局一致的无人机位置和姿态。本发明实现了对回环的快速检测,在保持检测准确度的同时提高了检测速度,减少了系统开销,可用于无环境先验信息的场景中进行无人机位姿估计。

    一种分层方向自适应快速选取方法

    公开(公告)号:CN104331933A

    公开(公告)日:2015-02-04

    申请号:CN201410566821.1

    申请日:2014-10-22

    CPC classification number: G06T17/30

    Abstract: 本发明公开了一种分层方向自适应快速选取方法,将三维模型三角网格化得到三角形面片后求出面积加权法向量;然后对面积加权法向量进行主成分分析,构造协方差矩阵并进行奇异值分解,得出三个特征向量作为候选分层方向;其后,在候选分层方向下对模型进行分层,并计算分层后构建模型和原始模型的总体积误差,最小总体积误差所对应的候选分层方向即为最优分层方向。本发明通过提取特征向量获得三个垂直正交的候选分层方向,并基于最小体积误差选择最优分层方向,无需将模型表面所有法向量或空间法向量的采样作为候选分层方向,提高模型精度的同时减少了算法复杂度,能够大大降低获得最优分层方向的时间,适用于几何特征或拓扑结构复杂的模型。

    基于FPGA的改进误差扩散算法IP核设计方法

    公开(公告)号:CN103607522A

    公开(公告)日:2014-02-26

    申请号:CN201310477261.8

    申请日:2013-10-11

    Abstract: 本发明涉及基于FPGA的改进误差扩散算法IP核设计方法,并将其封装成符合Avalon总线的IP核,便于通过SOPC方式快速集成到系统中去。算法采用四个独立通道实现了彩色误差扩散的并行处理、硬件优化实现了半色调及误差值生成、采用E-DLUT(误差值一误差扩散值查找表)替代了算法中的乘法运算、采用四级的流水线方式替代算法的串行处理,使得误差扩散模块平均只需一个时钟周期即可计算出一个像素点的半色调结果。整个设计满足实际应用需求。

    追溯打印纸质文档来源的系统及方法

    公开(公告)号:CN103024245A

    公开(公告)日:2013-04-03

    申请号:CN201210585854.1

    申请日:2012-12-14

    Abstract: 本发明公开一种追溯打印纸质文档来源的系统及方法,本发明的系统包括打印机、扫描仪、PC机和打印机驱动器,其中打印机驱动器包含数字水印嵌入模块,用于驱动打印机实现自动嵌入数字水印的打印功能。本发明方法的具体步骤为:1、提交打印任务;2、捕获打印数据;3、嵌入数字水印;4、打印纸质文档;5、扫描纸质文档;6、校正数字图像;7、提取数字水印;8、确定文档来源。本发明在有效地简化用户嵌入数字水印的操作流程和降低打印过程对数字水印嵌入算法影响的前提下,实现了打印纸质文档来源的追溯,达到了保护文档版权和追踪泄密途径的目的。

Patent Agency Ranking