-
公开(公告)号:CN119941925A
公开(公告)日:2025-05-06
申请号:CN202411995433.5
申请日:2024-12-31
Applicant: 喀什地区电子信息产业技术研究院
Abstract: 本发明属于图像处理技术领域,公开了一种基于多模态融合的文本驱动人脸编辑方法,以待处理源图像和文本提示作为输入;通过映射网络将初始隐编码映射到向量空间得到中间隐编码;将中间隐编码和源图像对应的隐编码分别输入生成器,得到第一生成图像和第二生成图像;利用文本损失、风格损失和人脸损失构建总损失,并利用总损失对生成图像隐编码进行优化,并生成最终的人脸图像。本发明对StyleGAN语义网络进行改进,并通过CLIP预训练模型对齐文本与图像特征,同时利用人脸识别网络对齐编辑前后人脸图像特征,以生成高质量、效果佳的人脸编辑图像,并实现属性解耦和保持人脸身份一致。
-
公开(公告)号:CN118570834A
公开(公告)日:2024-08-30
申请号:CN202410338146.0
申请日:2024-03-25
Applicant: 喀什地区电子信息产业技术研究院
IPC: G06V40/10 , G06V10/82 , G06N3/0475 , G06N3/084 , G06N3/082
Abstract: 本发明属于行人检测技术领域,公开了一种有限通信预算下的边缘设备行人检测模型构建方法,各边缘设备利用本地的行人目标检测数据集,对行人目标检测模型进行稀疏训练后剪枝得到轻量化行人目标检测模型,并发送给中心服务器;中心服务器将来自各边缘设备的轻量化行人目标检测模型进行聚合,然后反馈给各边缘设备,各边缘设备进行更新。本发明对YOLOv3主干网络进行改进,降低模型整体参数量,同时引入稀疏训练与剪枝,最终实现目标检测模型在轻量化的同时保持行人检测的准确率。
-
公开(公告)号:CN116630754A
公开(公告)日:2023-08-22
申请号:CN202310360864.3
申请日:2023-04-06
Applicant: 喀什地区电子信息产业技术研究院
IPC: G06V10/80 , G06V10/764 , G06V10/40 , G06N3/0464 , G06N3/08
Abstract: 本申请提供显著区域推断方法和系统,涉及目标检测的技术领域。在该方法中,服务器获取待检测图片的基础特征图;服务器根据多尺度通道注意力机制,对所述基础特征图进行多尺度特征提取,得到多尺度特征图;服务器将所述多尺度特征图输入至自适应特征融合网络中,得到所述待检测图片的显著区域,以完成对所述待检测图片的显著区域推断。实施本申请提供的技术方案,具有提高图片显著区域的推断准确性的效果。
-
公开(公告)号:CN116363579A
公开(公告)日:2023-06-30
申请号:CN202310211972.4
申请日:2023-03-07
Applicant: 电子科技大学 , 喀什地区电子信息产业技术研究院
Abstract: 本发明公开了一种重识别辅助的多阶段视频行人多目标跟踪方法及模型,搭建包括作为骨干网络的ResNet50、多层特征聚合模块、包括一个上下文抓取模块和一个注意力引导模块的注意力引导的上下文聚合模块、IDAUP子模块的MSMOT模型,并用其检测得到行人的检测边界框,并提取行人的重识别特征;注意力引导模块包括上下文注意力模块和内容注意力模块,IDAUP子模块输出浅层特征信息和深层特征信息分别作为重识别分支和检测分支的输入,检测分支采用三个并行的Head分别用于估计HeatMap、中心点的偏移以及边界框的尺寸;通过以卡尔曼滤波和匈牙利算法为基础的数据关联算法,依托检测边界框与重识别特征,完成检测边界框与相对应的行人轨迹之间的匹配。
-
公开(公告)号:CN118230087A
公开(公告)日:2024-06-21
申请号:CN202410250769.2
申请日:2024-03-06
Applicant: 喀什地区电子信息产业技术研究院
IPC: G06V10/774 , G06V10/77 , G06V10/82 , G06V10/46 , G06N3/0475 , G06N3/045 , G06N3/094
Abstract: 本发明属于人工智能安全技术领域,公开了一种基于降维与迁移的对抗样本生成方法,将待处理原始图像和真实标签输入白盒模型集合;从白盒模型集合中随机选取一个白盒模型,通过FGSM算法生成一个候选对抗样本;将生成的候选对抗样本输入黑盒模型进行查询,获得满足终止条件的中间对抗样本;对生成的中间对抗样本进行噪声压缩,生成最终对抗样本。本发明提高了对抗样本的生成效率,同时降低了对抗样本与原始图像之间的差异。
-
公开(公告)号:CN118155168A
公开(公告)日:2024-06-07
申请号:CN202410249964.3
申请日:2024-03-05
Applicant: 喀什地区电子信息产业技术研究院
IPC: G06V20/56 , G06V10/82 , G06V10/40 , G06T3/40 , G06N3/0464 , G06N3/0455 , G06N3/048 , G06N3/0495
Abstract: 本公开涉及计算机视觉技术领域,具体涉及一种基于深度可分离卷积的车道线检测方法、设备、存储介质及产品。该方法包括获取待检测图像;将待检测图像输入预训练的车道线检测模型;所述车道线检测模型包括依次连接的编码模块、特征聚合模块和解码模块;所述编码模块包括依次连接的多个瓶颈倒残差结构;利用编码模块通过多个瓶颈倒残差结构分别对待检测图像进行下采样,提取得到初始特征图;利用特征聚合模块提取初始特征图中的高级语义信息,得到聚合特征图;利用解码模块对聚合特征图进行双边上采样,输出得到车道线检测结果。通过利用多个瓶颈倒残差结构构建轻量化的特征提取骨干网络,减少了原有模型中参数量,极大的提高了车道线检测的速度。
-
公开(公告)号:CN118038094A
公开(公告)日:2024-05-14
申请号:CN202410099691.9
申请日:2024-01-24
Applicant: 电子科技大学 , 喀什地区电子信息产业技术研究院
Abstract: 本发明公开了一种面向动态场景的即时定位与建图方法、系统、存储介质及终端,属于视觉定位领域,包括:在ORB‑SLAM2框架中通过滑动窗口和模板匹配的方式检测当前图像帧中物体的运动状态,筛选出动态物体和静态物体;剔除动态物体上的特征点,保留静态物体上的特征点;将当前帧图像中的静态物体与地图中已构建的物体进行匹配,并根据匹配结果实时更新数据库;其中,若当前静态物体是新物体,则直接添加到数据库中;若当前静态物体不是新物体,则通过静态物体语义约束算法将其与数据库中同类物体进行匹配。本发明充分利用了静态物体的语义信息,能够获取精准的物体信息,实现对动态场景的即时响应和实时更新。同时,不依赖先验知识的特点,扩展了SLAM系统的通用性。
-
公开(公告)号:CN116909292A
公开(公告)日:2023-10-20
申请号:CN202311089826.5
申请日:2023-08-28
Applicant: 电子科技大学 , 喀什地区电子信息产业技术研究院
IPC: G05D1/02
Abstract: 本发明公开了一种基于伪激光雷达与激光雷达融合的机器人避障方法、系统、存储介质及终端,用于生成包含盲区小物体的栅格地图,属于扫地机器人技术领域,包括:分别获取激光雷达数据和伪激光雷达数据;通过联合标定的方式将所述伪激光雷达数据转为雷达坐标系下的数据;根据伪激光雷达数据修改相应范围内的激光雷达数据,得到融合数据;根据所述融合数据还原盲区小物体的信息并建立栅格地图。本发明利用融合数据,将小物体绘制在栅格地图上,可以仅利用栅格地图即可完成路径规划,且机器人离开当前区域后,栅格地图仍能保持小物体的栅格点,可以实现全局的路径规划,实现激光雷达盲区的矮小物体避障功能。
-
公开(公告)号:CN116861185A
公开(公告)日:2023-10-10
申请号:CN202310823327.8
申请日:2023-07-01
Applicant: 喀什地区电子信息产业技术研究院
IPC: G06F18/20 , G06F18/213 , G06N3/044 , G06N3/045 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于DCNN‑AM‑LSTM‑AE的居民短期电力负荷预测系统及方法,其包括特征提取模块,用于对居民用电量数据进行空洞卷积处理,提取相应特征;自动编码器中的编码器,用于基于注意力机制,对提取的相应特征进行重构,然后对重构特征进行编码;自动编码器中的解码器,用于对编码得到的特征进行解码;然后基于注意力机制,对解码得到的特征进行重构,重构特征经全连接处理得到居民短期电力负荷预测序列。本发明通过空洞卷积(DCNN)来提取初始特征;在时空特征提取上采用自动编码器(AE)结构,编码器结合注意力机制(AM)与LSTM;同时解码器则采用了LSTM、AM、MLP三种网络结构;能够更高效的利用数据,捕捉低负荷数据,从而极大的提高预测的准确度。
-
公开(公告)号:CN116630841A
公开(公告)日:2023-08-22
申请号:CN202310366264.8
申请日:2023-04-06
Applicant: 喀什地区电子信息产业技术研究院
Abstract: 一种基于注意力的目标检测方法和系统,涉及行人身份识别领域领域。在该方法中,包括以下步骤:获取待检测视频;通过第一特征网络对待检测视频包含的待检测视频帧进行处理,生成待检测视频的特征表示,所述第一特征网络包括简化ResNet底部网络以及空间金字塔顶部网络,简化ResNet底部网络用于提取待检测视频帧的多维视频帧特征,空间金字塔顶部网络用于对待检测视频帧的多维视频帧特征进行融合处理,生成所述待检测视频帧的特征表示;根据全部待检测视频帧的特征表示,在待检测视频中生成目标检测结果。通过采用本申请提供的技术方案,简化第一特征网络的结构,减少第一特征网络的参数数量,从而提升行人检测方法的检测速度。
-
-
-
-
-
-
-
-
-