-
公开(公告)号:CN116955683A
公开(公告)日:2023-10-27
申请号:CN202211247723.2
申请日:2022-10-12
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F16/55 , G06F16/583
Abstract: 本发明提供一种基于文本标签树的图像匹配方法及装置,该方法包括:获取目标图像;从文本标签树的元节点起始,按第N层的节点中的标签与N+1层中的节点之间的连接关系,确定遍历路线;按遍历路线,遍历文本标签树中的节点;将目标图像与所遍历的节点中的标签进行匹配,以确定匹配成功的标签;将元节点中的标签以及匹配成功的标签确定为目标图像的匹配标签;其中,N为大于或等于零的整数。由此,可根据第N层的节点中的标签与第N+1层中的节点之间的连接关系来构建文本标签树,以实现更细粒度、且结构化理解图像的能力。
-
公开(公告)号:CN116912896A
公开(公告)日:2023-10-20
申请号:CN202310264907.8
申请日:2023-03-17
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06V40/16 , G06V10/764
Abstract: 本申请公开了一种人脸属性识别方法、装置、设备及介质,该方法包括:根据目标人脸图像获取人脸识别特征;根据所述人脸识别特征和人脸属性分类器,获取所述目标人脸图像的人脸属性识别结果;其中,所述人脸属性分类器用于通过指定属性的分类区间和所述区间内指定属性的分类粒度对人脸进行分类。
-
公开(公告)号:CN116910532A
公开(公告)日:2023-10-20
申请号:CN202310356231.5
申请日:2023-04-04
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F18/214 , G06N3/084
Abstract: 本申请实施例公开了一种模型训练方法、模型训练装置、电子设备及计算机可读存储介质,其中,所述方法包括:将目标模型拆分为主干模型和附生模型;利用所述主干模型对训练集做正向推理,得到中间集;基于所述中间集,训练所述附生模型,得到训练后的附生模型;基于所述主干模型和训练后的附生模型,得到训练后的目标模型。
-
公开(公告)号:CN119233039A
公开(公告)日:2024-12-31
申请号:CN202411239898.8
申请日:2024-09-05
Applicant: 中国移动通信集团浙江有限公司 , 中国移动(浙江)创新研究院有限公司 , 中国移动通信有限公司 , 中国移动通信集团有限公司
IPC: H04N21/81 , H04N21/8549 , H04N21/44 , H04N21/4402 , H04N21/2343 , H04N21/234
Abstract: 本申请提供一种自定义区域动态视频生成方法、装置、设备、介质及产品,属于人工智能技术领域,获取用于视频生成内容描述的文本以及用于作为视频背景的图片;响应于用户在图片中选取的自定义区域,生成掩码图片;输入文本、图片和掩码图片至训练完成的视频生成模型,得到目标视频;视频生成模型通过在预设扩散模型中嵌入时序对齐模块和/或图像控制模块得到,时序对齐模型用于确定目标视频中每帧图像的时序,条件控制模块至少用于根据掩码图片确定目标视频的动态区域。本申请通过增加时序对齐模块以及条件控制模块优化视频生成质量及内容,并通过掩码操作实现指定区域的动态生成,解决了现有技术无法进行动态区域选择、视频内容难以控制的问题。
-
公开(公告)号:CN119206397A
公开(公告)日:2024-12-27
申请号:CN202411335740.0
申请日:2024-09-24
Applicant: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司 , 中国移动(浙江)创新研究院有限公司 , 浙江移动信息系统集成有限公司
IPC: G06V10/774 , G06V10/772 , G06V10/80 , G06V10/82 , G06V10/74 , G06N3/045 , G06N3/08 , G06N3/0895
Abstract: 本申请涉及人工智能技术领域,提供一种模型训练方法、装置、设备、存储介质及程序产品。方法包括:将样本图像输入至图像编码模块,获得图像特征;将样本文本输入至文本编码模块,获得文本特征;从预构建的融合提示向量词典中获取样本文本对应的融合提示向量,并将融合提示向量和文本特征输入至向量替换模块,获得混合文本特征;将图像特征和混合文本特征输入至检测器模块,训练视觉提示开集检测模型。通过上述方式,可避免模型出现过拟合或者评估失真的情况,提高视觉提示开集检测模型的泛化性能,降低模型训练开销。
-
公开(公告)号:CN118803045A
公开(公告)日:2024-10-18
申请号:CN202311541905.5
申请日:2023-11-16
Applicant: 中国移动通信集团浙江有限公司 , 中国移动(浙江)创新研究院有限公司 , 中国移动通信集团有限公司
IPC: H04L67/561 , H04L67/303
Abstract: 本申请涉及云计算技术领域,提供一种定制化服务部署方法、装置、设备及存储介质。该方法包括:获取目标用户针对定制化服务的服务生成请求;请求中携带目标用户的网络位置和定制化请求配置文件;根据网络位置确定定制化任务在算力网络中对应的最优算力节点;将定制化请求配置文件发送至最优算力节点进行服务部署。通过定制化请求配置文件中的任务向量引导定制化任务的输出结果,将定制化请求配置文件在算力网络间进行传输,使得定制化任务可以在适当的算力节点中实现低开销的部署,无需在算力网络下对算法模型或服务镜像进行调度存储,同时,可以避免业务场景扩充和长尾问题导致模型版本更新频繁,解决了定制化服务部署开销大的问题。
-
公开(公告)号:CN118799613A
公开(公告)日:2024-10-18
申请号:CN202410353054.X
申请日:2024-03-26
Applicant: 中国移动通信集团浙江有限公司 , 中国移动(浙江)创新研究院有限公司 , 中国移动通信集团有限公司
IPC: G06V10/764 , G06V10/74 , G06N5/025 , G06V10/774
Abstract: 本申请涉及目标检测技术领域,提供开集目标检测图像提示引导方法、装置、设备及存储介质,方法包括:提示向量初始化,根据显卡显存大小设置提示向量的数量和维度,构建双向解耦掩膜,双向解耦掩膜的长度与提示向量的长度相同,双向解耦掩膜包括分类子掩膜和定位子掩膜;根据样本数据集和双向解耦掩膜进行知识提取,以生成图像提示向量;双向解耦掩膜在分类和定位计算相似度时分别遮盖图像提示向量的不同区域;将待检测图像和与图像提示向量输入至目标检测模型,得到新类别的目标检测结果;图像提示向量用于引导目标检测模型实现新类别物体的检测。本申请避免了以往方法中手工调优文本提示的过程,减少人工成本,且具有更好的细粒度分类能力。
-
公开(公告)号:CN119445205A
公开(公告)日:2025-02-14
申请号:CN202411443367.0
申请日:2024-10-16
Applicant: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司 , 中国移动(浙江)创新研究院有限公司 , 浙江移动信息系统集成有限公司
IPC: G06V10/764 , G06V10/40 , G06V10/774
Abstract: 本发明提供一种目标检测方法、装置、设备、存储介质和计算机程序产品,涉及人工智能技术领域,该方法包括:获取待检测文本和待检测图像;将待检测文本和待检测图像输入开集目标检测模型,得到开集目标检测模型输出的检测结果;其中,开集目标检测模型包括图像信息与文本信息的混合模块,混合模块包括多层多头自注意力机制和多层基于类别引导的多头交叉注意力机制,混合模块用于对第一图像类别特征向量与待检测文本的文本特征进行增强,得到第一强化文本特征。本发明通过在开集目标检测模型中引入混合模块,将图像类别特征向量与文本特征相结合,使文本特征带有图像语义信息,从而减少语义歧义带来的影响,提高模型的零样本和少样本推理能力。
-
公开(公告)号:CN118823380A
公开(公告)日:2024-10-22
申请号:CN202410783011.5
申请日:2024-06-18
Applicant: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司 , 中国移动(浙江)创新研究院有限公司 , 浙江移动信息系统集成有限公司
IPC: G06V10/46 , G06V40/10 , G06N3/0442 , G06V10/82 , G06N3/08 , G06N3/0464
Abstract: 本发明提供一种人体关键点检测方法、装置、电子设备及存储介质,涉及人工智能技术领域,该方法通过关键点检测模型中的主干网络,提取待检测图像中的人体区域特征,滤除待检测图像中的背景信息,为后续操作提供准确的数据。通过特征提取网络中的门注意力单元,利用人体区域特征,提取到待检测图像中的细化关键点表示,为关键点位置检测网络对人体关键点位置信息的准确预测提供依据,保证人体关键点位置信息的准确性。采用的门注意力单元中应用较少的卷积模块,可以降低关键点检测模型的结构参数量,进而提升关键点检测模型的预测效率,有助于实现人体关键点位置信息的快速实时检测。人体关键点位置信息可用于运动评估、姿态检测等下游任务使用。
-
公开(公告)号:CN118823316A
公开(公告)日:2024-10-22
申请号:CN202410921119.6
申请日:2024-07-10
Applicant: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司 , 中国移动(浙江)创新研究院有限公司
IPC: G06V10/25 , G06V20/70 , G06V10/40 , G06V10/764 , G06V10/82
Abstract: 本申请实施例提供了一种目标检测方法、装置、电子设备和存储介质,该目标检测方法包括:获取目标图像,目标图像包括待检测的第一目标对象;将目标图像输入至检测模型;通过检测模型的提示编码模块从目标图像中提取第一目标对象的第一图像语义信息,第一图像语义信息用于对第一目标对象进行描述;通过检测模型的图像编码模块提取目标图像的第一图像特征;将第一图像语义信息和第一图像特征输入至检测模型的检测模块进行目标检测,输出第一目标对象所属的类别。
-
-
-
-
-
-
-
-
-