-
公开(公告)号:CN116916368A
公开(公告)日:2023-10-20
申请号:CN202310562622.2
申请日:2023-05-18
Applicant: 中国移动通信有限公司研究院 , 北京邮电大学 , 中国移动通信集团有限公司
Abstract: 本申请公开一种小区分类方法、装置、设备及可读存储介质,涉及无线网技术领域,该方法包括:根据动态蜂窝网络的与不同时间步相关的数据集、动态蜂窝网络针对不同时间步的拓扑图,自适应获取动态蜂窝网络的各小区在相应时间步的空间特征;其中,不同时间步包括相邻的第一时间步和第二时间步,且第一时间步位于第二时间步之前;根据各小区在第一时间步的空间特征、各小区在第二时间步的空间特征和第一小区的原始标签,进行相似特征迁移,获得第二小区的类别;其中,第一小区为动态蜂窝网络在第一时间步已存在的小区,第二小区为动态蜂窝网络在第二时间步增加的小区。本申请的方案提升了小区分类的准确性。
-
公开(公告)号:CN116912915A
公开(公告)日:2023-10-20
申请号:CN202310914916.7
申请日:2023-07-25
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06V40/16 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/045
Abstract: 本申请公开了一种人脸识别方法、装置及电子设备,涉及通信技术领域,以解决现有人脸识别效果较差的问题。该方法包括:分别对第一图像数据和第二图像数据进行特征提取,得到第一模态特征和第二模态特征;对第一模态特征和第二模态特征进行融合处理,得到第一融合特征;分别对第一模态特征和第二模态特征进行整合处理,得到第一模态整合特征和第二模态整合特征;对第一模态整合特征、第二模态整合特征和第一融合特征进行融合处理,得到第二融合特征;根据第二融合特征,确定人脸识别结果。本申请实施例通过对人脸不同模态的图像数据在特征层进行两阶段融合,能够实现对多模态图像数据更深层次的融合,进而提高人脸识别效果。
-
公开(公告)号:CN116912540A
公开(公告)日:2023-10-20
申请号:CN202211627076.8
申请日:2022-12-16
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06V10/764 , G06V20/40 , G06V10/74 , G06V10/774 , G06N3/04 , G06N3/084
Abstract: 本发明公开了一种行为识别方法、装置和存储介质,其中,方法包括:对目标视频进行前景目标提取,确定所述目标视频中每帧图像的运动区域;运用预设的特征提取方法对所述运动区域进行特征提取,得到特征结果;所述特征结果至少包括:第一特征值、第二特征值;所述第一特征值为光流方向周期一致性特征值,所述第二特征值为光流幅度周期一致性特征值;运用预设的行为识别模型识别所述每帧图像对应的特征结果,得到识别结果;所述识别结果表征所述目标视频是否具有目标行为。
-
公开(公告)号:CN116912470A
公开(公告)日:2023-10-20
申请号:CN202310217377.1
申请日:2023-03-08
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06V10/20 , G06V10/82 , G06V10/40 , G06V10/56 , G06V10/80 , G06T5/00 , G06N3/0464 , G06N3/045 , G06N3/08
Abstract: 本申请提供一种图像处理方法、装置、存储介质和电子设备,其中,方法包括将第一图像输入第一神经网络模型,获得第一图像的特征图;将特征图输入第二神经网络模型,获得第二图像。其中,第二图像的清晰度高于第一图像,第一神经网络模型包括用于确定特征图的图像尺寸的第一卷积网络和至少一个用于特征提取的第二卷积网络,第二神经网络模型为对应第一神经网络模型设置的解码模型。本申请实施例提供的方法提高了图像处理的效率。
-
公开(公告)号:CN116912467A
公开(公告)日:2023-10-20
申请号:CN202211658143.2
申请日:2022-12-22
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
Abstract: 本申请公开了一种图像拼接方法、装置、设备及存储介质。该方法包括:获取初始拼接图像,初始拼接图像为对待拼接的第一图像和第二图像经特征提取、特征匹配及图像变换后得到的拼接图像;基于训练好的自监督优化模型将初始拼接图像转换为目标拼接图像;其中,训练好的自监督优化模型用于确定初始拼接图像的优化残差,并将优化残差和初始拼接图像相加得到目标拼接图像。由于引入了自监督优化模型,可以确定初始拼接图像的优化残差,并将优化残差和初始拼接图像相加得到目标拼接图像,有效缓解了单应矩阵计算不准确、场景深度以及不同视角光照变化等对图像拼接质量的影响,进而提高了图像拼接质量,利于满足拼接图像的后续应用需求。
-
公开(公告)号:CN116912368A
公开(公告)日:2023-10-20
申请号:CN202310505008.2
申请日:2023-05-06
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06T13/00 , G06N3/0475 , G06N3/045 , G06N3/08
Abstract: 本发明提供了一种图像动画生成方法、装置、设备及存储介质,涉及计算机技术领域。所述图像动画生成方法,包括:获取驱动视频和源图像;对所述驱动视频和所述源图像分别进行运动表示学习,得到所述源图像的光流图和所述驱动视频的修复掩码图;将所述源图像、所述光流图和第一信息输入第一网络模型,得到所述第一网络模型输出的所述源图像的图像动画;其中,所述第一信息包括所述驱动视频和所述修复掩码图拼接后的图像信息;所述第一网络模型对所述图像动画中的遮挡区域进行修复。本发明的方案,解决了现有技术中生成的图像动画的精确度低的问题。
-
公开(公告)号:CN116910404A
公开(公告)日:2023-10-20
申请号:CN202310348879.8
申请日:2023-04-04
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F16/958 , G06F16/955 , G06F18/25 , G06F18/241 , G06N3/045
Abstract: 本发明提供了一种网页信息抽取与分类方法及装置,属于人工智能技术领域。网页信息抽取与分类方法,包括:将目标网页的源码转换为dom树;对所述dom树的每个结点进行处理,得到四个特征矩阵:文本特征矩阵、Xpath特征矩阵、layout布局特征矩阵和视觉特征矩阵;将所述四个特征矩阵分别输入编码网络,得到四个表征向量;将所述四个表征向量进行特征融合,得到融合特征,将所述融合特征输入分类网络,得到并存储所述目标网页的信息单元的分类结果,所述分类结果包括以下至少一项:表格;需填充表单;需要链接到下一个网页展示的文本单元;导航栏或者展示栏;纯文本;广告和无用信息。本发明的技术方案能够提高网页信息抽取与分类方案的通用性。
-
公开(公告)号:CN116910253A
公开(公告)日:2023-10-20
申请号:CN202310861026.4
申请日:2023-07-13
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F16/35 , G06F40/295 , G06F16/332 , G06F18/25 , G06F18/213 , G06N3/0442
Abstract: 本发明提供了一种文档处理方法及装置,属于人工智能技术领域。文档处理方法,包括:获取待处理文档;识别所述待处理文档的文档信息,所述文档信息包括以下至少一种类型:文字信息、图像信息、布局信息;对不同类型的文档信息分别进行特征提取,得到每一类型所述文档信息对应的特征向量;将不同类型所述文档信息的特征向量进行融合,得到所述待处理文档的文档特征向量。本发明的技术方案能够对不同类型的文档进行处理。
-
公开(公告)号:CN116909723A
公开(公告)日:2023-10-20
申请号:CN202211548496.7
申请日:2022-12-05
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F9/50
Abstract: 本申请公开了一种容量调度方法、装置、设备及可读存储介质,涉及云计算技术领域,以提高资源利用率。该方法包括:确定第一命名空间的资源配额;创建所述第一命名空间中的pod;根据第一pod请求的资源以及所述第一命名空间的资源配额,确定所述第一命名空间对应的目标节点的目标资源,所述第一pod为所述pod中的一个或多个;基于所述目标资源,将所述第一pod调度到所述目标节点上。本申请实施例可以提高资源利用率。
-
公开(公告)号:CN116737885A
公开(公告)日:2023-09-12
申请号:CN202210199563.2
申请日:2022-03-02
Applicant: 中国移动通信有限公司研究院 , 清华大学 , 中国移动通信集团有限公司
IPC: G06F16/332 , G06F40/35
Abstract: 本申请公开了一种信息处理方法、装置、设备和可读存储介质,涉及计算机技术领域,以提高端到端任务型对话系统的输出的准确性。该方法包括:获取用户的输入信息;将所述输入信息作为端到端任务型对话系统的输入,得到输出信息;其中,所述端到端任务型对话系统所采用的处理模型通过基于生成式预训练模型的有监督的预训练、并在预训练获得的模型基础上进行半监督训练获得。本申请实施例可以提高端到端任务型对话系统的输出的准确性。
-
-
-
-
-
-
-
-
-