-
公开(公告)号:CN118799894A
公开(公告)日:2024-10-18
申请号:CN202311516535.X
申请日:2023-11-14
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
Abstract: 本公开提供了一种文字识别方法、神经网络的训练方法、装置、设备及介质,其中,该方法包括:获取待识别文档,并确定所述待识别文档中文字的极坐标信息;其中,所述极坐标信息用于指示任意两个文字之间的相对位置关系;基于所述极坐标信息确定各所述文字的高斯布局信息;其中,所述高斯布局信息用于指示所述任意两个文字之间的关联程度;将所述高斯布局信息融合至文档预训练模型中的自注意力网络,并基于融合后的所述文档预训练模型确定所述待识别文档的文档识别结果。
-
公开(公告)号:CN118799850A
公开(公告)日:2024-10-18
申请号:CN202410104103.6
申请日:2024-01-25
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06V20/62 , G06V30/146 , G06V30/18 , G06V30/19 , G06F16/908 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种基站设备识别方法、装置、设备及介质。该方法包括:基于旋转检测模型,检测出第一图像的第一关键区域,其中,所述第一图像是针对目标基站设备的图像;所述第一关键区域包括所述目标基站设备的标识信息;基于文字识别模型,识别出所述第一关键区域内的符合设备标识规则的第一标识信息;基于训练后的特征提取模型,提取所述第一关键区域的第一特征信息;检索预设特征库,获得与所述第一特征信息匹配的第二标识信息;根据所述第一标识信息和所述第二标识信息,确定所述目标基站设备的标识信息。本发明的方法能够快速识别出基站设备的型号,提升设备识别效率。
-
公开(公告)号:CN118799670A
公开(公告)日:2024-10-18
申请号:CN202410009597.X
申请日:2024-01-02
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06V10/774 , G06V10/764 , G06V20/70 , G06V10/74
Abstract: 本发明公开了一种目标检测模型的训练方法、目标检测方法及装置、设备,所述训练方法包括:获取负样本集合,从所述负样本集合中挖掘目标数量的负样本,并作为训练负样本;在模型训练的过程中,根据所述训练负样本计算位置可信度的损失值;根据所述位置可信度的损失值调整模型参数,获得目标检测模型。采用本发明的技术方案通过负样本挖掘的方式增加负样本的训练,能够平衡正负样本的比例,将负样本考虑到位置可信度的训练过程中,避免训练过程中出现模型在位置可信度预测时偏向预测较大分数的问题,从而提高了模型在位置可信度预测时的精确性,并提高了模型的泛化能力。
-
公开(公告)号:CN118799633A
公开(公告)日:2024-10-18
申请号:CN202410835678.5
申请日:2024-06-26
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06V10/764 , G06V10/82 , G06V10/80 , G06V10/44 , G06N3/0499 , G06F18/22 , G06F18/25 , G06F18/213
Abstract: 本申请提供一种图像分类方法、装置及可读存储介质,涉及人工智能技术领域。该图像分类方法包括:将待分类图像和第一文本输入至多模态基础模型,得到待分类图像对应的第一图像特征和第一文本对应的第一文本特征,第一文本用于指示所述待分类图像的图像局部信息,且多模态基础模型具有零样本分类能力;将第一图像特征和第一文本特征输入至目标多层感知机模型,得到第一预测结果,第一预测结果包括所述目标多层感知机模型预测的所述待分类图像属于N个预设图像类别的概率,目标多层感知机模型用于对第一图像特征和第一文本特征进行特征转换、特征融合以及图像分类处理;根据所述第一预测结果,确定所述待分类图像的图像类别。
-
公开(公告)号:CN118797432A
公开(公告)日:2024-10-18
申请号:CN202410346106.0
申请日:2024-03-25
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F18/241 , G06F18/214 , G06N3/045 , G06N3/08
Abstract: 本申请公开了一种模型训练方法、装置、设备、存储介质及计算机程序产品。其中,该模型训练方法包括:获取目标训练数据,并基于所述目标训练数据对分类模型进行训练,得到所述分类模型相关的模拟数据;获取标签类型序列;基于所述标签类型序列和所述分类模型相关的模拟数据,确定第一损失函数;利用所述第一损失函数更新第一编码器网络和第二编码器网络的参数,直至所述第一损失函数的损失值收敛,生成噪声标签检测模型。
-
公开(公告)号:CN118735425A
公开(公告)日:2024-10-01
申请号:CN202310317358.6
申请日:2023-03-27
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
Abstract: 本申请公开了一种交互上下文的管理方法、装置、设备、系统及存储介质,涉及通信技术领域,以提高对供应商和运营商之间的交互过程进行管理的灵活性。该方法包括:获取通信对端的交互上下文,所述通信对端的交互上下文包括上下文标识;根据所述通信对端的交互上下文进行处理,并根据处理结果获得本地交互上下文;向所述通信对端发送所述本地交互上下文,所述本地交互上下文包括所述上下文标识。本申请实施例可以提高对供应商和运营商之间的交互过程进行管理的灵活性。
-
公开(公告)号:CN116976399A
公开(公告)日:2023-10-31
申请号:CN202211170759.5
申请日:2022-09-23
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06N3/0455 , G06N3/045 , G06N3/0499 , G06N3/09 , G06F18/214
Abstract: 本申请公开了一种故障预测模型的训练方法、故障预测方法、装置、电子设备及存储介质,其中,故障预测模型的训练方法包括:基于不同时刻的故障事件样本中每个故障事件样本的事件类型和事件发生时间,生成第一序列编码;基于所述第一序列编码训练故障预测模型,直至达到设定的收敛条件;其中,所述故障预测模型包括编码器和解码器;所述编码器用于基于线性归一化的注意力机制获取所述第一序列编码的隐状态;所述解码器用于基于所述第一序列编码的隐状态,对故障事件的事件类型和事件发生时间进行预测。
-
公开(公告)号:CN116975264A
公开(公告)日:2023-10-31
申请号:CN202211326436.0
申请日:2022-10-27
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F16/35 , G06N3/045 , G06N3/047 , G06N3/084 , G06N3/0895 , G06Q30/0282 , G06Q10/20 , G06Q50/30
Abstract: 本申请实施例公开了一种识别方法、终端及存储介质;终端获取待识别信息;利用目标识别模型对待识别信息进行识别处理,获得待识别信息的识别结果;其中,目标识别模型是对预训练后的模型进行微调处理获得的;微调处理包括设置有预设松弛因子的预设对比学习任务。
-
公开(公告)号:CN116958616A
公开(公告)日:2023-10-27
申请号:CN202210373908.1
申请日:2022-04-11
Applicant: 中国移动通信有限公司研究院 , 清华大学 , 中国移动通信集团有限公司
IPC: G06V10/764 , G06V10/774 , G06N3/084
Abstract: 本申请提供一种分类模型训练方法、图像识别方法及相关设备,分类模型训练方法包括:使用图像分类模型分别对多个第一样本数据进行前向传播计算,以得到多个第一样本数据的第一损失值,图像分类模型包括多个出口,每一第一样本数据的第一损失值包括在多个出口的损失值,多个第一样本数据为第一采样得到的图像帧数据;使用权重预测模型对多个第一样本数据的第一损失值进行权重预测,得到多个第一样本数据分别在每一出口的目标权重;基于多个第一样本数据分别在每一出口的预测权重,以及多个第一样本数据的第一损失值,对图像分类模型进行训练,得到用于对图像进行分类的图像分类模型。本申请可以提升模型性能。
-
公开(公告)号:CN116955658A
公开(公告)日:2023-10-27
申请号:CN202311011297.7
申请日:2023-08-11
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F16/435 , G06F16/48
Abstract: 本申请提供一种媒体资源推荐方法、装置及电子设备,该方法包括:获取第一媒体资源集中每个媒体资源的三元组信息,媒体资源的三元组信息包括:媒体资源的第一属性信息,媒体资源关联的第二属性信息以及第一属性信息与第二属性信息之间的关系;将第一媒体资源集中每个媒体资源的三元组信息输入已训练的文本生成模型,生成第一媒体资源集中每个媒体资源的资源描述内容;获取第二媒体资源集中媒体资源的资源描述内容和图像信息,目标媒体资源包括第一媒体资源集以及第二媒体资源集;基于待推荐用户的历史行为记录,以及目标媒体资源集中媒体资源的资源描述内容和图像信息,从目标媒体资源集中确定待推荐用户的推荐媒体资源,以提高媒体资源推荐效果。
-
-
-
-
-
-
-
-
-