-
公开(公告)号:CN119445205A
公开(公告)日:2025-02-14
申请号:CN202411443367.0
申请日:2024-10-16
Applicant: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司 , 中国移动(浙江)创新研究院有限公司 , 浙江移动信息系统集成有限公司
IPC: G06V10/764 , G06V10/40 , G06V10/774
Abstract: 本发明提供一种目标检测方法、装置、设备、存储介质和计算机程序产品,涉及人工智能技术领域,该方法包括:获取待检测文本和待检测图像;将待检测文本和待检测图像输入开集目标检测模型,得到开集目标检测模型输出的检测结果;其中,开集目标检测模型包括图像信息与文本信息的混合模块,混合模块包括多层多头自注意力机制和多层基于类别引导的多头交叉注意力机制,混合模块用于对第一图像类别特征向量与待检测文本的文本特征进行增强,得到第一强化文本特征。本发明通过在开集目标检测模型中引入混合模块,将图像类别特征向量与文本特征相结合,使文本特征带有图像语义信息,从而减少语义歧义带来的影响,提高模型的零样本和少样本推理能力。
-
公开(公告)号:CN118798134A
公开(公告)日:2024-10-18
申请号:CN202410409906.2
申请日:2024-04-07
Applicant: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司 , 中国移动(浙江)创新研究院有限公司 , 浙江移动信息系统集成有限公司
IPC: G06F40/16 , G06F40/284 , G06N20/00 , G06F16/38
Abstract: 本申请公开了一种内容生成方法、装置、电子设备和可读存储介质,属于计算机领域。包括:获取目标文本,目标文本包括用于指示内容生成的关键词;向人工智能生成内容模型输入目标文本;通过人工智能生成内容模型得到与目标文本相匹配的目标生成内容;其中,在通过人工智能生成内容模型得到目标生成内容的过程中,人工智能生成内容模型基于第一向量和第二向量,生成目标结果,目标结果用于得到目标生成内容;第一向量为人工智能生成内容模型基于所述目标文本生成的向量,第二向量为从向量数据库中获取的与目标文本相关联的向量,向量数据库获取所述第二向量的时间比获取用于训练人工智能生成内容模型的历史数据的时间更晚。
-
公开(公告)号:CN119206397A
公开(公告)日:2024-12-27
申请号:CN202411335740.0
申请日:2024-09-24
Applicant: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司 , 中国移动(浙江)创新研究院有限公司 , 浙江移动信息系统集成有限公司
IPC: G06V10/774 , G06V10/772 , G06V10/80 , G06V10/82 , G06V10/74 , G06N3/045 , G06N3/08 , G06N3/0895
Abstract: 本申请涉及人工智能技术领域,提供一种模型训练方法、装置、设备、存储介质及程序产品。方法包括:将样本图像输入至图像编码模块,获得图像特征;将样本文本输入至文本编码模块,获得文本特征;从预构建的融合提示向量词典中获取样本文本对应的融合提示向量,并将融合提示向量和文本特征输入至向量替换模块,获得混合文本特征;将图像特征和混合文本特征输入至检测器模块,训练视觉提示开集检测模型。通过上述方式,可避免模型出现过拟合或者评估失真的情况,提高视觉提示开集检测模型的泛化性能,降低模型训练开销。
-
公开(公告)号:CN119180941A
公开(公告)日:2024-12-24
申请号:CN202411227943.8
申请日:2024-09-03
Applicant: 中国移动通信集团浙江有限公司 , 中国移动(浙江)创新研究院有限公司 , 中国移动通信集团有限公司 , 中国移动通信有限公司
IPC: G06V10/25 , G06V10/764 , G06V10/40 , G06N5/04 , G06F18/213 , G06F18/22 , G06F18/25
Abstract: 本发明提供一种基于多标签分类的开集目标检测方法、装置、设备和介质,其中方法包括:在开集目标检测模型的融合层的任意一层中嵌入多标签分类层;将多标签分类层和开集目标检测模型的前K层转换为第一推理层,将开集目标检测模型的后N‑K层转换为第二推理层;将目标图像和预设的M个目标类别文本输入至第一推理层,得到图像特征和M个文本特征,以及M个目标类别文本的置信度;基于M个目标类别文本的置信度,对M个文本特征进行过滤,得到过滤后的m个文本特征;在m值不为零的情况下,将过滤后的m个文本特征和图像特征输入至第二推理层,得到目标图像的分类结果。本发明推理加速效果好,无需额外训练成本,不影响定位准确率,通用性强。
-
公开(公告)号:CN118823316A
公开(公告)日:2024-10-22
申请号:CN202410921119.6
申请日:2024-07-10
Applicant: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司 , 中国移动(浙江)创新研究院有限公司
IPC: G06V10/25 , G06V20/70 , G06V10/40 , G06V10/764 , G06V10/82
Abstract: 本申请实施例提供了一种目标检测方法、装置、电子设备和存储介质,该目标检测方法包括:获取目标图像,目标图像包括待检测的第一目标对象;将目标图像输入至检测模型;通过检测模型的提示编码模块从目标图像中提取第一目标对象的第一图像语义信息,第一图像语义信息用于对第一目标对象进行描述;通过检测模型的图像编码模块提取目标图像的第一图像特征;将第一图像语义信息和第一图像特征输入至检测模型的检测模块进行目标检测,输出第一目标对象所属的类别。
-
公开(公告)号:CN118803045A
公开(公告)日:2024-10-18
申请号:CN202311541905.5
申请日:2023-11-16
Applicant: 中国移动通信集团浙江有限公司 , 中国移动(浙江)创新研究院有限公司 , 中国移动通信集团有限公司
IPC: H04L67/561 , H04L67/303
Abstract: 本申请涉及云计算技术领域,提供一种定制化服务部署方法、装置、设备及存储介质。该方法包括:获取目标用户针对定制化服务的服务生成请求;请求中携带目标用户的网络位置和定制化请求配置文件;根据网络位置确定定制化任务在算力网络中对应的最优算力节点;将定制化请求配置文件发送至最优算力节点进行服务部署。通过定制化请求配置文件中的任务向量引导定制化任务的输出结果,将定制化请求配置文件在算力网络间进行传输,使得定制化任务可以在适当的算力节点中实现低开销的部署,无需在算力网络下对算法模型或服务镜像进行调度存储,同时,可以避免业务场景扩充和长尾问题导致模型版本更新频繁,解决了定制化服务部署开销大的问题。
-
公开(公告)号:CN118799613A
公开(公告)日:2024-10-18
申请号:CN202410353054.X
申请日:2024-03-26
Applicant: 中国移动通信集团浙江有限公司 , 中国移动(浙江)创新研究院有限公司 , 中国移动通信集团有限公司
IPC: G06V10/764 , G06V10/74 , G06N5/025 , G06V10/774
Abstract: 本申请涉及目标检测技术领域,提供开集目标检测图像提示引导方法、装置、设备及存储介质,方法包括:提示向量初始化,根据显卡显存大小设置提示向量的数量和维度,构建双向解耦掩膜,双向解耦掩膜的长度与提示向量的长度相同,双向解耦掩膜包括分类子掩膜和定位子掩膜;根据样本数据集和双向解耦掩膜进行知识提取,以生成图像提示向量;双向解耦掩膜在分类和定位计算相似度时分别遮盖图像提示向量的不同区域;将待检测图像和与图像提示向量输入至目标检测模型,得到新类别的目标检测结果;图像提示向量用于引导目标检测模型实现新类别物体的检测。本申请避免了以往方法中手工调优文本提示的过程,减少人工成本,且具有更好的细粒度分类能力。
-
-
-
-
-
-