-
公开(公告)号:CN119541548A
公开(公告)日:2025-02-28
申请号:CN202411602213.1
申请日:2024-11-11
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本申请公开了一种音频处理方法、装置、设备、存储介质及程序产品,涉及数据处理技术领域,公开的音频处理方法:获取多个待处理音频文件;对各待处理音频文件进行质量评估,得到各待处理音频文件的质量评估结果;在质量评估结果为有效音频的情况下,将对应的待处理音频文件作为有效音频文件;在质量评估结果为无效音频的情况下,将对应的待处理音频文件作删除处理;在质量评估结果为除有效音频和无效音频之外的其他评估结果的情况下,将对应的待处理音频文件进行自优化处理。本申请由于对除有效数据和无效数据之外的其他数据做了自优化处理,使得整个数据集的质量得到了提升,解决了如何提升大模型的多模态标注数据的整体质量的问题。
-
公开(公告)号:CN119248726A
公开(公告)日:2025-01-03
申请号:CN202411345865.1
申请日:2024-09-25
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本申请公开了一种基于窗口多级扩展的文档检索方法、装置、设备、存储介质及程序产品,涉及文档检索技术领域,包括:对文档进行切分,得到多个子文档,并对多个子文档配置初始窗口;获取用户查询信息,基于多个子文档和所述用户查询信息进行初次检索,得到用户查询信息与初始窗口的初始相似度;对初始窗口进行扩展,得到扩展窗口和对应的扩展子文档,并根据用户查询信息和扩展子文档进行多次检索,得到所述用户查询信息与扩展窗口之间的参考相似度;基于初始相似度和参考相似度完成窗口扩展,得到目标扩展窗口和对应的目标子文档,完成文档检索,通过动态窗口扩展策略来优化检索过程,提高文本检索系统的准确性和相关性。
-
公开(公告)号:CN119474268A
公开(公告)日:2025-02-18
申请号:CN202411515274.4
申请日:2024-10-28
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/332 , G06F16/2455 , G06F40/289 , G06V30/19
Abstract: 本申请公开了一种信息检索方法、装置、设备、存储介质及产品。其中,该方法包括:接收对待检索文本进行检索的检索指令,所述检索指令用于利用所述待检索文本在文档集合中查找对应的检索结果,所述文档集合包括多层文档,每层文档的文档颗粒度自上而下依次减小;利用所述待检索文本在所述文档集合中自下而上依次进行递归检索,得到与所述每层文档均对应的第一结果;对所述第一结果进行处理,得到所述检索结果。本实施例能够提高信息检索的检索结果的全面性。
-
公开(公告)号:CN119272755A
公开(公告)日:2025-01-07
申请号:CN202411606550.8
申请日:2024-11-11
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/211 , G06F18/22 , G06Q40/08
Abstract: 本申请公开了一种文本切分方法、装置、设备、存储介质及产品,涉及文本处理技术领域,包括获取目标长文本,目标长文本包括多个依次排列的短句;计算相邻短句之间的相似度得分,得到目标长文本的相似度序列;对相似度序列进行平滑处理,得到平滑相似度序列;基于平滑相似度序列以及拆分阈值,对目标长文本进行切分。本申请通过对相似度得分序列进行平滑,减弱极端相似度得分对整体序列的影响,避免因个别异常值导致的误判或误差,提高文本切分结果的稳健性。
-
公开(公告)号:CN119515697A
公开(公告)日:2025-02-25
申请号:CN202411603758.4
申请日:2024-11-11
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本申请公开了一种图像融合方法、装置、设备、存储介质及程序产品,涉及图像处理技术领域,公开的图像融合方法通过生成原始图像与目标主体的融合图像的第一噪声图像,在第一噪声图像中与编辑区域对应的背景区域内填充随机高斯噪声,生成第二噪声图像,分别利用第一噪声图像、第一噪声图像结合文本提示信息和第二噪声图像结合文本提示信息,提取得到第一特征向量、第二特征向量和第三特征向量,来融合得到生成目标融合图像的目标特性向量。本申请在进行图像编辑时,可以直接应用预训练的SDM模型根据目标特征向量生成目标融合图像,解决了如何扩展图像编辑方法的应用场景的技术问题。
-
公开(公告)号:CN119295187A
公开(公告)日:2025-01-10
申请号:CN202411605412.8
申请日:2024-11-11
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06Q30/0601 , G06F18/23 , G06F40/289 , G06F18/22
Abstract: 本申请公开了一种推荐方法、装置、设备、存储介质及产品,涉及人工智能技术领域。本申请通过获取多个用户组信息,构建目标图数据,从而对用户组、用户已订阅的业务以及用户已使用的设备之间的联系清楚地结构化表达,保证后续谱聚类的准确度;对目标图数据进行谱聚类,基于聚类结果的聚类簇,对用户组推荐处于同一个聚类簇的未订阅业务和未使用设备,从而实现更准确地营销,为用户推荐更符合其需求的内容。
-
公开(公告)号:CN119416912A
公开(公告)日:2025-02-11
申请号:CN202411570728.8
申请日:2024-11-05
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本申请公开了一种大模型连续学习方法、电子设备、介质及产品,涉及人工智能技术领域,本申请方案将结合低秩矩阵、模型输入量以及上个训练轮次的正交投影矩阵构建当前正交投影矩阵,由于第二低秩矩阵具有低秩性,可用于约束当前训练轮次对应训练样本中的模型输入量的维度,避免最后构建的当前正交投影矩阵维度太大造成计算复杂。且正交投影矩阵相当于被集成在整个框架中,可简化计算流程节约计算资源。在训练过程中再使用当前正投影矩阵对得到的模型更新梯度进行约束,避免进行新的学习任务过程时遗忘过去学习的知识,从而引发生连续性学习过程中的灾难性遗忘问题。故本申请解决了当前解决灾难性遗忘问题方案需占用较大计算机资源的问题。
-
公开(公告)号:CN119360154A
公开(公告)日:2025-01-24
申请号:CN202411412079.9
申请日:2024-10-10
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06V10/774 , G06V20/70 , G06V10/764 , G06V10/74
Abstract: 本申请公开了一种大模型训练数据生成方法、装置、设备、存储介质及产品,涉及人工智能技术领域,所述的方法包括:通过提取用于模型训练的图像数据集中数据的语义标签信息和图像特征信息;根据语义标签信息和图像特征信息生成联合向量;根据联合向量和预设分类模型确定预设图像数据对应的聚合类别;基于预设图像数据对应的聚合类别生成大模型训练数据。本申请通过根据预设图像数据的语义标签信息和图像特征信息生成联合向量,然后基于分类模型确定类别,从而能够基于图像数据丰富的语义信息进行图像分类,相较于现有的基于单一的图像信息能够提高图像分类结果的准确性,基于类别自动生成训练数据,从而提高了数据生成的效率。
-
公开(公告)号:CN119202314A
公开(公告)日:2024-12-27
申请号:CN202411311472.9
申请日:2024-09-19
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/783 , G06V20/40 , G06V10/82
Abstract: 本申请公开了一种视频检索方法、装置、设备及产品,涉及人工智能技术领域,公开了视频检索方法,包括:对待检索视频按照固定采样频率进行视频帧抽取,得到第一视频帧序列;根据所述第一视频帧序列的内容复杂度和/或系统资源使用率确定目标采样频率,并基于所述目标采样频率对所述第一视频帧序列进行视频帧抽取,得到第二视频帧序列;对所述第二视频帧序列中的视频帧进行特征提取,并基于提取的特征从视频库中检索出所述待检索视频对应的相似视频,实现视频的分析精度与计算资源使用的平衡。
-
-
-
-
-
-
-
-