基于基线定位与序列建模的自然场景下的藏文识别方法

    公开(公告)号:CN115116072A

    公开(公告)日:2022-09-27

    申请号:CN202210819627.4

    申请日:2022-07-12

    Abstract: 本发明属于文本识别技术领域,具体涉及一种基于基线定位与序列建模的自然场景下的藏文识别方法,本发明包括:1)构建自然场景下的藏文图像数据集并进行标注;2)扩充数据集并对数据集图像进行预处理;3)构建基线检测器,对藏文文本的基线位置进行定位;4)构建特征提取器,使用不同的特征提取方法获取横竖排文本图像的序列特征表示;5)构建基于TCN的序列建模网络,建模序列关系;6)构建CTC转录模块,将表征序列关系的输出特征送入转录层得到藏文识别的结果。本发明通过上述技术方案,极大的增强了特征提取、序列关系建模的有效性,提高了序列的并行处理能力,进而提高了自然场景下藏文识别的精度和效率。

    一种高分辨率遥感影像道路自动提取的方法

    公开(公告)号:CN115100540A

    公开(公告)日:2022-09-23

    申请号:CN202210778771.8

    申请日:2022-06-30

    Abstract: 本发明涉及视频图像处理技术领域,尤其涉及一种高分辨率遥感影像道路自动提取的方法,本发明通过加入多Agent系统,在深度卷积神经网络模型的训练过程中,在输入的高分辨率遥感影像上分区域创建生成Agent,由生成Agent随机生成大量的提取Agent,不同的提取Agent负责遍历不同的区域,再将路图迭代生成算法模型加入每个提取Agent的生命周期中,通过同一区域内不同提取Agent间、提取Agent和生成Agent间,以及不同区域的生成Agent间的信息共享、协同合作完成整张遥感影像的道路提取任务。本发明通过多Agent技术实现模型高效训练,又能利用深度学习的强大特征学习能力,实现高效率和高准确性的高分辨率遥感影像道路提取。

    一种人体动作的轻量化在线检测方法

    公开(公告)号:CN114613004A

    公开(公告)日:2022-06-10

    申请号:CN202210206087.2

    申请日:2022-02-28

    Abstract: 本发明属于视频处理技术领域,具体涉及一种人体动作的轻量化在线检测方法,本发明包括:步骤1:采集视频数据并标注分块;步骤2:对视频块预处理并生成在线检测数据集;步骤3:基于SlowFast构建特征提取网络,得到视频块特征;步骤4:构建基于双路孪生网络对特征进行辨别性映射;步骤5:构建基于Informer概率稀疏注意力与注意力蒸馏的时序编码器,得到时序编码特征;步骤6:构建基于Informer概率稀疏注意力的时序解码器进行时序解码,将解码结果送入分类器得到人体动作在线检测结果,基于多时态检测结果对整体网络联合优化;本发明通过上述技术方案,极大减少了时序推理运算量,提高了在线动作检测效率和精度。

    一种基于先验交互强化学习的胎儿超声图像脑部分割方法

    公开(公告)号:CN114332139A

    公开(公告)日:2022-04-12

    申请号:CN202111641824.3

    申请日:2021-12-29

    Abstract: 本发明公开了一种基于先验交互强化学习的胎儿超声图像脑部分割方法,属于医学图像分割和深度学习领域。本发明将胎儿超声图像脑部分割转化为环境状态转换模块、环境奖励转换模块和提示图更新模块三个部分,环境奖励转换模块通过标签数据和预测数据计算环境奖励值;提示图更新模块使用提示图更新网络对当前的结果提供新的提示图来细化下一次分割的结果;环境状态转换模块对动作概率进行预测并评估当前状态组合,不断迭代更新当前状态值直至分割结果满意为止。本发明可实现对胎儿脑部结构端到端的分割,拥有较高的准确率,为胎儿胼胝体发育状态识别的智能分析提供有利的数据基础以及性能保障,对未来的智能医疗相关研究有深远意义。

    基于多级网络的图像语义快速分割方法

    公开(公告)号:CN109241872B

    公开(公告)日:2022-03-18

    申请号:CN201810947526.9

    申请日:2018-08-20

    Abstract: 本发明公开一种基于多级网络的图像语义快速分割方法,涉及图像语义分割和深度学习领域,本方法中构建的多级语义分割模型包括第一级网络,第二级网络和第三级网络,第一级网络包括包含layer的密集连接块和卷积层,第二级网络包括包含layer的密集连接块、级联层和卷积层,第三级网络包括包含layer的密集连接块、级联层和卷积层,第二级网络的级联层通过上采样层连接第一级网络的卷积层,第三级网络的级联层通过上采样层连接第二级网络的级联层;第一级网络、第二级网络和第三级网络的每一个密集连接块后还连接INPLACE‑ABN;每个密集连接块中的layer的输入都包含了前面所有的layer输出的级联后的特征图;本发明解决了现有技术中的图像语义分割速度与精度不能兼顾的问题。

    基于双向长短期记忆网络的人脸属性识别方法及系统

    公开(公告)号:CN109190514B

    公开(公告)日:2021-10-01

    申请号:CN201810921302.0

    申请日:2018-08-14

    Abstract: 本发明公开了一种基于双向长短期记忆网络的人脸属性识别方法及系统,该人脸属性识别方法包括:获取人脸图像数据集;将获取的人脸图像数据集进行图像预处理后,生成人脸图像训练集;构建基于双向长短期记忆网络的深度神经网络,将人脸图像训练集作为输入对所述深度神经网络进行训练,得到深度神经网络模型;将待识别的测试图像输入至训练好的深度神经网络模型进行人脸属性识别。本发明通过改进卷积神经网络,并增加双向长短期记忆网络构建深度神经网络,利用长短期记忆网络对于序列相关性的建模能力,学习不同任务得到的人脸属性特征之间的相关性和特异性,从而提高人脸属性识别的准确度。

    一种基于生成对抗网络的人体行为预测方法及系统

    公开(公告)号:CN112633377A

    公开(公告)日:2021-04-09

    申请号:CN202011550178.5

    申请日:2020-12-24

    Abstract: 本发明提出了一种基于生成对抗网络的人体行为预测方法及系统,所述预测方法包括如下步骤:获取完整视频数据,并对完整视频数据进行预处理,获得预处理后的完整视频数据,作为样本数据集;构建基于生成对抗网络的人体行为预测模型;利用样本数据集对人体行为预测模型进行训练,获得训练后的人体行为预测模型;将待预测视频段输入训练后的人体行为预测模型,在训练后的人体行为预测模型中进行前向传播,输出待预测视频段的后预设帧数的时间段的动作类别。本发明利用生成对抗网络的特征生成器生成后预设帧数的视频帧图像,然后利用行为分类器对后预设帧数的视频帧图像进行识别,获得行为识别结果,实现了对不完整的视频序列的行为识别。

    一种目标检测方法及系统
    98.
    发明公开

    公开(公告)号:CN110598586A

    公开(公告)日:2019-12-20

    申请号:CN201910794312.7

    申请日:2019-08-27

    Abstract: 本发明公开一种目标检测方法及系统。本发明提供的目标检测方法及系统,首先通过模式引导分类模型对待检测图像的场景模式进行识别,然后根据场景模式选择目标检测模型中对应场景的目标检测子模型进行目标检测,获得检测目标的位置信息。本发明首先将多场景的检测任务进行模式分离后,然后在相应的模式分支里进行精准的目标检测,从而在不需要大量扩充网络深度或宽度的前提下,对目标进行高精度检测。

    一种增强特征学习的小目标检测及识别方法

    公开(公告)号:CN110503112A

    公开(公告)日:2019-11-26

    申请号:CN201910794606.X

    申请日:2019-08-27

    Abstract: 本发明公开了一种增强特征学习的小目标检测及识别方法,属于图像处理、模式识别及计算机视觉领域,解决现有技术中小目标检测与识别任务检测精度低且网络效率低的问题。本发明依次构建基础网络模块、特征提取模块、候选框产生模块和预测输出模块作为小目标检测与识别网络;基于提取小目标样本图像数据,并对提取的小目标样本图像数据进行预处理;得到预处理的小目标样本图像数据输入初始化了参数的小目标检测与识别网络中进行训练,得到训练好后的小目标检测与识别网络;将待预测的小目标图像输入已经训练好的小目标检测与识别网络,通过前向传播,实现端到端地输出小目标的预测框位置与类别信息。本发明用于小目标检测与识别。

    基于生成式对抗网络的轻量级人脸检测方法

    公开(公告)号:CN110458133A

    公开(公告)日:2019-11-15

    申请号:CN201910762210.7

    申请日:2019-08-19

    Abstract: 本发明涉及基于生成式对抗网络的轻量级人脸检测方法,包括:A.构建人脸检测数据集;B.根据基于关键点的实时高精度目标检测算法,建立基于生成式对抗网络的轻量级人脸检测模型;C.对所述的轻量级人脸检测模型进行训练,并根据损失,进行随机梯度下降,更新模型参数;D.输入一张待检测的人脸图片,通过训练好的轻量级人脸检测模型进行一次前向传播,输出含有标注信息的人脸检测图片。本发明在检测过程中能够更易于生成更清晰的人脸,由此大幅度提高了检测的速度和准确性。

Patent Agency Ranking