-
公开(公告)号:CN119941925A
公开(公告)日:2025-05-06
申请号:CN202411995433.5
申请日:2024-12-31
Applicant: 喀什地区电子信息产业技术研究院
Abstract: 本发明属于图像处理技术领域,公开了一种基于多模态融合的文本驱动人脸编辑方法,以待处理源图像和文本提示作为输入;通过映射网络将初始隐编码映射到向量空间得到中间隐编码;将中间隐编码和源图像对应的隐编码分别输入生成器,得到第一生成图像和第二生成图像;利用文本损失、风格损失和人脸损失构建总损失,并利用总损失对生成图像隐编码进行优化,并生成最终的人脸图像。本发明对StyleGAN语义网络进行改进,并通过CLIP预训练模型对齐文本与图像特征,同时利用人脸识别网络对齐编辑前后人脸图像特征,以生成高质量、效果佳的人脸编辑图像,并实现属性解耦和保持人脸身份一致。
-
公开(公告)号:CN119131719A
公开(公告)日:2024-12-13
申请号:CN202411054021.1
申请日:2024-08-02
Applicant: 电子科技大学 , 喀什地区电子信息产业技术研究院
IPC: G06V20/56 , G06V20/00 , G06V10/44 , G06V10/74 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/045
Abstract: 本发明涉及机器人自主导航与视觉识别技术领域,公开了一种域不变信息挖掘的视觉场景识别方法,采用主干网络VGG‑DIMM、聚合头NetVLAD两部分组成DIMNet模型实现,包括下述步骤:对于给定的输入图像,利用VGG‑DIMM初步提取其局部特征描述符;以VGG‑DIMM提取得到的局部特征描述符作为输入,使用原始的NetVLAD将局部特征描述符聚合成一维的全局特征描述符F(I);通过相似度算法,将查询图像的全局特征描述符F(I)与所有数据库图像的全局特征描述符F(I)进行一一比较,从而找出所有和查询图像归属同一场景的数据库图像;通过所采用的域不变信息挖掘模块(DIMM)在级联的卷积单元组中,纳入特征图不同空间区域间的相互依赖关系,达到DIMNet模型对域不变的静态类物体的关注度增强的目的。
-
公开(公告)号:CN118099683A
公开(公告)日:2024-05-28
申请号:CN202410319064.1
申请日:2024-03-20
Applicant: 中国电子科技集团公司第五十四研究所 , 北京邮电大学 , 辽宁工业大学 , 喀什地区电子信息产业技术研究院
Abstract: 本发明公开了一种太赫兹波段串并联综合MEMS开关,属于射频前端器件领域。整体结构由直流端口金属块,直流偏置线,微带线匹配结构,复合梁MEMS开关,金属梁MEMS开关,金属电极,氮化硅绝缘层,硅基衬底,共面波导金属地和背附金属地组成。复合梁MEMS开关由二氧化硅材料固支梁和吸附在其下方的金属梁组合而成,金属梁MEMS开关并排于复合梁MEMS开关;可以通过在直流端口输入不同直流电压来控制开关的断开与导通状态;本发明设计的串并联综合MEMS开关工作在500GHz以下,均可以保证断开状态隔离度高于20dB;导通状态插入损耗低于2dB。微秒量级的反应时间,且不易发生破坏性形变;结构简单,制造方便,可以通过玻璃基工艺进行制造。
-
公开(公告)号:CN116630754A
公开(公告)日:2023-08-22
申请号:CN202310360864.3
申请日:2023-04-06
Applicant: 喀什地区电子信息产业技术研究院
IPC: G06V10/80 , G06V10/764 , G06V10/40 , G06N3/0464 , G06N3/08
Abstract: 本申请提供显著区域推断方法和系统,涉及目标检测的技术领域。在该方法中,服务器获取待检测图片的基础特征图;服务器根据多尺度通道注意力机制,对所述基础特征图进行多尺度特征提取,得到多尺度特征图;服务器将所述多尺度特征图输入至自适应特征融合网络中,得到所述待检测图片的显著区域,以完成对所述待检测图片的显著区域推断。实施本申请提供的技术方案,具有提高图片显著区域的推断准确性的效果。
-
公开(公告)号:CN116363579A
公开(公告)日:2023-06-30
申请号:CN202310211972.4
申请日:2023-03-07
Applicant: 电子科技大学 , 喀什地区电子信息产业技术研究院
Abstract: 本发明公开了一种重识别辅助的多阶段视频行人多目标跟踪方法及模型,搭建包括作为骨干网络的ResNet50、多层特征聚合模块、包括一个上下文抓取模块和一个注意力引导模块的注意力引导的上下文聚合模块、IDAUP子模块的MSMOT模型,并用其检测得到行人的检测边界框,并提取行人的重识别特征;注意力引导模块包括上下文注意力模块和内容注意力模块,IDAUP子模块输出浅层特征信息和深层特征信息分别作为重识别分支和检测分支的输入,检测分支采用三个并行的Head分别用于估计HeatMap、中心点的偏移以及边界框的尺寸;通过以卡尔曼滤波和匈牙利算法为基础的数据关联算法,依托检测边界框与重识别特征,完成检测边界框与相对应的行人轨迹之间的匹配。
-
公开(公告)号:CN119323802A
公开(公告)日:2025-01-17
申请号:CN202411438787.X
申请日:2024-10-15
Applicant: 电子科技大学 , 喀什地区电子信息产业技术研究院
IPC: G06V40/10 , G06V10/74 , G06V10/764 , G06V10/80 , G06V10/82 , G06V10/86 , G06N3/042 , G06N3/045 , G06N3/0464
Abstract: 本发明公开了基于异构图语义区分的行人再识别方法、计算机程序产品及终端,属于图像处理技术领域,包括以下步骤:以特征块作为节点分支、节点之间的边缘关系作为边缘分支建立异构图,并将相同或相似分类标签的节点进行聚合,以反映语义关联;根据相邻节点的特征表示进行聚合处理,并根据亲和属性值筛选语义更接近的节点对;根据相关性对节点特征进行聚合处理,得到跨时空的聚合特征;根据跨时空的聚合特征执行Re‑ID任务。本发明对节点之间的语义相关性进行度量,成功区分出了噪声、非目标语义和目标语义,在不牺牲有效信息的前提下,最大限度地聚合目标语义,保证语义区分和信息保留的可行性,增强对遮挡目标的语义感知能力。
-
公开(公告)号:CN119169086A
公开(公告)日:2024-12-20
申请号:CN202410469578.5
申请日:2024-04-18
Applicant: 电子科技大学 , 喀什地区电子信息产业技术研究院
Abstract: 本发明公开了一种面向动态场景的双目视觉SLAM方法、电子设备和存储介质,针对从双目相机获取的当前帧图像和先前帧图像,所述方法包括以下步骤:获取所述当前帧图像和所述先前帧图像;分别提取当前帧图像的静态特征点和动态特征点、先前帧图像的静态特征点和动态特征点;得到当前帧图像和先前帧图像的位姿;连续跟踪关联物体;输出当前帧图像中所有物体的运动状态;根据当前帧图像中所有物体的运动状态,进行特征点的重过滤;基于更新特征点后的当前帧图像进行定位和建图。本发明充分利用了相机获得的有效信息,能够实现在动态场景下的相机位姿的准确估计和地图建立,具有较强的鲁棒性和稳定性。
-
公开(公告)号:CN118840628A
公开(公告)日:2024-10-25
申请号:CN202410930760.6
申请日:2024-07-11
Applicant: 喀什地区电子信息产业技术研究院
IPC: G06V10/774 , G06V10/764 , G06V10/82 , G06N3/084
Abstract: 本发明属于人工智能安全技术领域,公开了基于数据增强和梯度约束的对抗样本生成方法及黑盒攻击方法,该对抗样本生成方法为:通过增加扰动对当前迭代过程的待处理图像进行若干次数据增强,并通过替代模型获取对抗梯度;对对抗梯度进行约束;并基于约束后的对抗梯度对梯度动量进行迭代更新;再依据迭代更新后的梯度动量生成对抗样本。本发明能提升对抗样本的迁移攻击成功率,更为有效的评估模型的鲁棒性。
-
公开(公告)号:CN118508071A
公开(公告)日:2024-08-16
申请号:CN202410810087.2
申请日:2024-06-21
Applicant: 北京邮电大学 , 中国电子科技集团公司第五十四研究所 , 喀什地区电子信息产业技术研究院
Abstract: 本发明公开了一种毫米波超宽带宽波束磁电偶极子天线单元及天线,属于射频前端器件领域;其天线单元包括辐射体和馈电模块;辐射体包含有两个位于同一平面且对称设置的矩形贴片;两个矩形贴片的远离侧均与对应的斜置贴片连接;馈电模块为T型结构,且其位于所述平面内;其中一矩形贴片的内侧设有圆形缝隙,T型结构的中间枝节末端位于圆形缝隙中,且与矩形贴片无接触;T型结构的中间枝节末端通过金属通孔I穿过地板,接入馈电层;所述矩形贴片通过金属通孔II与底板连接。本发明在Ka波段附近频段内达到超过54%阻抗带宽的性能,以及H面的波束宽度在频段内维持在112度到135度范围内,还具备在工作频段内的高增益性能。
-
公开(公告)号:CN118379512A
公开(公告)日:2024-07-23
申请号:CN202410602366.X
申请日:2024-05-15
Applicant: 电子科技大学 , 喀什地区电子信息产业技术研究院
Abstract: 本发明公开了一种级联型全局描述符聚合的视觉场景识别方法,摒弃以往主流的局部特征聚合技术,提出一种新的整体特征聚合方案,利用具有SCA模块和GIA模块的GICNet模型完成,包括下述步骤:1)利用嵌入SCA模块的改进CNN主干网络提取查询图像I的中间特征表达FSCA;2)将3‑D张量的中间特征表达FSCA重新塑造为一个2‑D表示,得到展平特征图Fflat,此时的2‑D张量的展平特征图Fflat视为一组大小为d的1‑D特征;3)将展平特征图Fflat输入到GIA模块中进行处理,利用全连接层的能力递归地将通道方向和空间方向上的全局关系合并到2‑D展平的特征图Fflat的每个元素中,最终得到鲁棒性的全局描述子FGIA;将全局描述子FGIA依次进行展平操作和L2‑norm处理,得到查询图像I的最终的1‑D判别向量Fdiscr。
-
-
-
-
-
-
-
-
-