-
公开(公告)号:CN119474268A
公开(公告)日:2025-02-18
申请号:CN202411515274.4
申请日:2024-10-28
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/332 , G06F16/2455 , G06F40/289 , G06V30/19
Abstract: 本申请公开了一种信息检索方法、装置、设备、存储介质及产品。其中,该方法包括:接收对待检索文本进行检索的检索指令,所述检索指令用于利用所述待检索文本在文档集合中查找对应的检索结果,所述文档集合包括多层文档,每层文档的文档颗粒度自上而下依次减小;利用所述待检索文本在所述文档集合中自下而上依次进行递归检索,得到与所述每层文档均对应的第一结果;对所述第一结果进行处理,得到所述检索结果。本实施例能够提高信息检索的检索结果的全面性。
-
公开(公告)号:CN119272758A
公开(公告)日:2025-01-07
申请号:CN202411345617.7
申请日:2024-09-25
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/226 , G06F40/216 , G06F40/284 , G06N20/00
Abstract: 本申请公开了一种模型训练方法、文本纠错方法、装置、设备、介质及产品,应用于人工智能技术领域。该方法先将训练文本进行分词,并映射到高维嵌入表示,以转换得到目标词向量表示,即BERT embeddings的过程。然后将目标词向量表示输入初始文本纠错模型中进行强化学习,本方案结合了BERT embeddings与强化学习单元的聚合操作,仅需要较少的文本完成训练,且能够捕捉语义关系,实现语法、标点符号以及用词的纠错,同时提升文本表征和分类能力。能够适应公文文本纠错场景,具有较好的纠错效果。
-
公开(公告)号:CN119272755A
公开(公告)日:2025-01-07
申请号:CN202411606550.8
申请日:2024-11-11
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/211 , G06F18/22 , G06Q40/08
Abstract: 本申请公开了一种文本切分方法、装置、设备、存储介质及产品,涉及文本处理技术领域,包括获取目标长文本,目标长文本包括多个依次排列的短句;计算相邻短句之间的相似度得分,得到目标长文本的相似度序列;对相似度序列进行平滑处理,得到平滑相似度序列;基于平滑相似度序列以及拆分阈值,对目标长文本进行切分。本申请通过对相似度得分序列进行平滑,减弱极端相似度得分对整体序列的影响,避免因个别异常值导致的误判或误差,提高文本切分结果的稳健性。
-
公开(公告)号:CN119150022A
公开(公告)日:2024-12-17
申请号:CN202411178149.9
申请日:2024-08-26
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司 , 北京邮电大学
IPC: G06F18/214 , G06F18/213 , G06F16/9535 , G06N5/022 , G06N3/042 , G06N3/045 , G06N3/0895
Abstract: 本申请公开了一种模型训练方法、项目推荐方法、装置、设备、介质及产品。该方法包括:获取多个训练样本;将训练样本输入至预设的项目推荐模型,通过项目推荐模型对二分图样本进行特征提取,得到第一特征向量,以及通过项目推荐模型对知识图谱样本进行特征提取,得到第二特征向量;通过项目推荐模型对第一特征向量和第二特征向量进行对比学习,得到第一损失函数值;在不满足训练停止条件的情况下,基于第一损失函数值调整项目推荐模型的模型参数,并利用多个训练样本训练参数调整后的项目推荐模型,直至满足训练停止条件,得到训练好的项目推荐模型。这样可以使训练好的项目推荐模型准确性更高,预测的推荐项目更能满足用户需求。
-
公开(公告)号:CN118553247A
公开(公告)日:2024-08-27
申请号:CN202410875327.7
申请日:2024-07-01
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G10L15/26 , G10L21/0208 , G10L21/007 , G10L21/0316
Abstract: 本发明公开了一种通话人员身份识别方法、电子设备、存储介质及程序产品,涉及人工智能技术领域,通话人员身份识别方法包括:将通话人员的通话语音转换成对应的语音文本,并将所述语音文本与多个预设词库分别进行比对,确定各所述预设词库分别对应的相似特征参数,其中,各所述预设词库至少包括诈骗术语词库;若存在诈骗术语词库对应的相似特征参数,则根据所述通话人员的互联网协议IP地址对诈骗术语词库对应的相似特征参数进行更新;将相似特征参数最高的预设词库对应的人员类型确定为通话人员的身份类型。本发明的技术方案提高了对通话人员身份类型的识别准确性。
-
公开(公告)号:CN116304369A
公开(公告)日:2023-06-23
申请号:CN202310188803.3
申请日:2023-02-21
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/9536 , G06Q50/00 , G06F18/213 , G06F18/24
Abstract: 本申请公开了一种家庭网络的确定方法、装置、设备及存储介质。该方法包括:获取N个第一用户的通信特征;根据通信特征确定N个第一用户组成的至少一个用户对的至少一个亲密度;利用至少一个亲密度构建以N个第一用户为节点的社交网络;在社交网络中确定目标用户对,其中,目标用户对包括第一目标用户和第二目标用户,第一目标用户和第二目标用户属于同一个家庭网络,家庭网络中的所有节点均为同一个家庭的成员,根据目标用户对在社交网络中筛选出Q个目标闭环路径;将第一目标用户、第二目标用户以及Q个目标闭环路径中的节点确定为剪枝网络;并对剪枝网络进行裁剪,得到家庭网络。根据本申请实施例,能够提高家庭关系识别的准确性。
-
公开(公告)号:CN119416912A
公开(公告)日:2025-02-11
申请号:CN202411570728.8
申请日:2024-11-05
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本申请公开了一种大模型连续学习方法、电子设备、介质及产品,涉及人工智能技术领域,本申请方案将结合低秩矩阵、模型输入量以及上个训练轮次的正交投影矩阵构建当前正交投影矩阵,由于第二低秩矩阵具有低秩性,可用于约束当前训练轮次对应训练样本中的模型输入量的维度,避免最后构建的当前正交投影矩阵维度太大造成计算复杂。且正交投影矩阵相当于被集成在整个框架中,可简化计算流程节约计算资源。在训练过程中再使用当前正投影矩阵对得到的模型更新梯度进行约束,避免进行新的学习任务过程时遗忘过去学习的知识,从而引发生连续性学习过程中的灾难性遗忘问题。故本申请解决了当前解决灾难性遗忘问题方案需占用较大计算机资源的问题。
-
公开(公告)号:CN119360154A
公开(公告)日:2025-01-24
申请号:CN202411412079.9
申请日:2024-10-10
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06V10/774 , G06V20/70 , G06V10/764 , G06V10/74
Abstract: 本申请公开了一种大模型训练数据生成方法、装置、设备、存储介质及产品,涉及人工智能技术领域,所述的方法包括:通过提取用于模型训练的图像数据集中数据的语义标签信息和图像特征信息;根据语义标签信息和图像特征信息生成联合向量;根据联合向量和预设分类模型确定预设图像数据对应的聚合类别;基于预设图像数据对应的聚合类别生成大模型训练数据。本申请通过根据预设图像数据的语义标签信息和图像特征信息生成联合向量,然后基于分类模型确定类别,从而能够基于图像数据丰富的语义信息进行图像分类,相较于现有的基于单一的图像信息能够提高图像分类结果的准确性,基于类别自动生成训练数据,从而提高了数据生成的效率。
-
公开(公告)号:CN119293340A
公开(公告)日:2025-01-10
申请号:CN202411604968.5
申请日:2024-11-11
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/9535 , G06N3/045 , G06F18/25 , G06F18/243 , G06F40/289 , G06F18/2415 , G06N3/08 , G06N3/084
Abstract: 本申请公开了一种内容推荐方法、装置、设备、存储介质及产品,涉及大模型技术领域,包括获取目标用户的多个特征信息;对多个特征信息进行自然语言拼接,获得用户画像描述文本;将用户画像描述文本输入特征融合模型,得到目标用户的融合特征;特征融合模型为BERT模型;将融合特征输入内容推荐模型,获得内容推荐预测结果。本申请通过多维特征筛选与自然语言拼接,并结合BERT模型进行语义编码,能够充分捕捉自然语言文本的上下文语义信息,使得训练得到的特征融合模型能够更好地理解用户需求和偏好,从而使得输出的融合特征为用户提供个性化和语境化的处理,使使用融合特征进行的内容推荐更加贴合用户的偏好,实现了更精准和符合用户特定需求的推荐。
-
公开(公告)号:CN119003578A
公开(公告)日:2024-11-22
申请号:CN202411102908.3
申请日:2024-08-12
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/2453 , G06F16/242 , G06F16/25
Abstract: 本申请实施例公开了一种信息处理方法、装置、设备、介质及程序产品。该方法包括:获取抽取‑转换‑加载ETL任务中的结构化查询语言清单,结构化查询语言清单包括多个结构化查询语言;对结构化查询语言清单进行执行流程复杂度评估,得到ETL任务的执行流程复杂度评分;对多个结构化查询语言进行语法复杂度评估,得到语法复杂度评分;根据执行流程复杂度评分以及语法复杂度评分,按照预设的优化规则生成优化建议信息。本申请实施例能够对数据中台程序ETL流程及SQL的复杂度进行评估,以及时进行优化。
-
-
-
-
-
-
-
-
-