-
公开(公告)号:CN119941925A
公开(公告)日:2025-05-06
申请号:CN202411995433.5
申请日:2024-12-31
Applicant: 喀什地区电子信息产业技术研究院
Abstract: 本发明属于图像处理技术领域,公开了一种基于多模态融合的文本驱动人脸编辑方法,以待处理源图像和文本提示作为输入;通过映射网络将初始隐编码映射到向量空间得到中间隐编码;将中间隐编码和源图像对应的隐编码分别输入生成器,得到第一生成图像和第二生成图像;利用文本损失、风格损失和人脸损失构建总损失,并利用总损失对生成图像隐编码进行优化,并生成最终的人脸图像。本发明对StyleGAN语义网络进行改进,并通过CLIP预训练模型对齐文本与图像特征,同时利用人脸识别网络对齐编辑前后人脸图像特征,以生成高质量、效果佳的人脸编辑图像,并实现属性解耦和保持人脸身份一致。
-
公开(公告)号:CN119323802A
公开(公告)日:2025-01-17
申请号:CN202411438787.X
申请日:2024-10-15
Applicant: 电子科技大学 , 喀什地区电子信息产业技术研究院
IPC: G06V40/10 , G06V10/74 , G06V10/764 , G06V10/80 , G06V10/82 , G06V10/86 , G06N3/042 , G06N3/045 , G06N3/0464
Abstract: 本发明公开了基于异构图语义区分的行人再识别方法、计算机程序产品及终端,属于图像处理技术领域,包括以下步骤:以特征块作为节点分支、节点之间的边缘关系作为边缘分支建立异构图,并将相同或相似分类标签的节点进行聚合,以反映语义关联;根据相邻节点的特征表示进行聚合处理,并根据亲和属性值筛选语义更接近的节点对;根据相关性对节点特征进行聚合处理,得到跨时空的聚合特征;根据跨时空的聚合特征执行Re‑ID任务。本发明对节点之间的语义相关性进行度量,成功区分出了噪声、非目标语义和目标语义,在不牺牲有效信息的前提下,最大限度地聚合目标语义,保证语义区分和信息保留的可行性,增强对遮挡目标的语义感知能力。
-
公开(公告)号:CN118115836A
公开(公告)日:2024-05-31
申请号:CN202410250749.5
申请日:2024-03-05
Applicant: 喀什地区电子信息产业技术研究院
IPC: G06V10/774 , G06V20/58 , G06V10/82 , G06V10/25 , G06N3/0475 , G06N3/045 , G06N3/0464 , G06N3/094 , G06N3/084
Abstract: 本发明属于人工智能安全技术领域,公开了一种基于BigGAN的交通标志物理对抗样本生成方法、设备、存储介质及产品。该方法采集交通标志数据集作为原始训练样本;基于YOLOv3目标检测器,得到各原始训练样本上交通标志的检测框;采用预训练的BigGAN生成器生成交通标志的初始对抗样本;对初始对抗样本进行数据增强,并结合各原始训练样本上交通标志的检测框,生成敌对训练样本;基于YOLOv3目标检测器,对敌对训练样本进行交通标志检测训练;通过反向传播、更新梯度等,优化对抗样本。本发明能够限制生成的交通标志对抗样本的外观形状,且提高对抗样本的攻击性。
-
公开(公告)号:CN118015331A
公开(公告)日:2024-05-10
申请号:CN202311871274.3
申请日:2023-12-30
Applicant: 喀什地区电子信息产业技术研究院
IPC: G06V10/764 , G06V10/778 , G06F21/62 , G06N20/00 , G06V10/82 , G06V10/80 , G06N3/0455 , G06N3/098
Abstract: 本发明公开了一种基于隐私保护的医学图像分类方法,包括获取待分类的医学图像;在客户端和服务端分别构建用于医学图像分类的本地模型和全局模型,在客户端通过输出扰动向上传的本地模型参数引入差分隐私噪声获取引入差分隐私噪声的本地模型梯度信息,并在服务端将不同客户端的本地模型梯度信息进行聚合,以对全局模型参数进行更新,实现基于差分隐私的联邦学习训练;利用客户端训练后的本地模型对待分类的医学图像进行医学图像分类。本发明在客户端对上传的模型以输出扰动的形式进行差分隐私噪声添加,有效保护数据隐私以及抵御推理攻击。
-
公开(公告)号:CN117132954A
公开(公告)日:2023-11-28
申请号:CN202311096618.8
申请日:2023-08-28
Applicant: 电子科技大学 , 喀什地区电子信息产业技术研究院
IPC: G06V20/56 , G06V20/70 , G06V10/26 , G06V10/764 , G06V10/84
Abstract: 本发明公开了一种基于语义栅格地图的机器人场景识别方法、系统、存储介质及终端,属于室内移动机器人场景识别技术领域,包括:获取语义栅格地图,并根据语义栅格地图得到封闭的轮廓图;对封闭的轮廓图进行区域分割与语义物体类别提取,得到子区域以及语义物体;计算当前子区域为特定家居场景的概率值,并根据所述概率值识别子区域所在场景。本发明基于语义栅格地图的场景识别方法不受限于模型以及算力,可以实现扫地机器人快速准确地识别出场景,更好地完成与场景有关的指令任务。
-
公开(公告)号:CN117409232A
公开(公告)日:2024-01-16
申请号:CN202311127529.5
申请日:2023-08-31
Applicant: 喀什地区电子信息产业技术研究院
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06V10/30 , G06V10/77
Abstract: 本发明公开了一种基于改进注意力机制的医学图像分类方法,包括获取用于分类的医学图像数据集,并对医学图像数据集进行预处理;构建基于改进注意力机制的医学图像分类网络模型,利用预处理后的医学图像数据集进行模型训练;利用训练后的基于改进注意力机制的医学图像分类网络模型对待分类医学图像进行分类,得到待分类医学图像的分类结果。本发明通过构建基于改进注意力机制的医学图像分类网络模型,能够降低模型的参数数量和计算复杂度,提高模型的计算效率和泛化能力,并且进一步提高网络的性能,使得医学图像的分类准确率与精确度得到了提高,在保持模型性能和泛化能力的前提下,还能提高模型的计算效率。
-
-
-
-
-