-
公开(公告)号:CN118797034A
公开(公告)日:2024-10-18
申请号:CN202310988899.1
申请日:2023-08-08
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司 , 北京邮电大学
IPC: G06F16/34 , G06N3/045 , G06N3/08 , G06N3/0499
Abstract: 本发明提供了一种文本摘要生成方法、装置、设备和可读存储介质,涉及人工智能技术领域。所述文本摘要生成方法,包括:获取目标文本和所述目标文本对应的目标用户查询文本;根据所述目标文本和所述目标用户查询文本,生成第一信息;将所述第一信息输入文本摘要生成模型,得到目标用户查询文本对应的目标文本摘要;所述文本摘要生成模型是根据历史训练文本、所述历史训练文本对应的历史用户查询文本和所述历史用户查询文本对应的历史摘要文本,对所述历史训练文本进行排序并训练生成。本发明方案,可以提高生成文本摘要的生成效率和准确性。
-
公开(公告)号:CN118797464A
公开(公告)日:2024-10-18
申请号:CN202310994307.7
申请日:2023-08-08
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司 , 北京邮电大学
IPC: G06F18/2415 , G06N5/04 , G06F18/214 , G06N3/045 , G06N3/08 , G10L15/18
Abstract: 本发明提供一种模型训练方法、设备以及介质,涉及人工智能领域,其中,所述模型训练方法包括:利用第一训练数据集,对初始模型进行训练,得到第一模型;在需要利用第二数据集对所述第一模型进行更新的情况下,利用所述第一模型对所述第二数据集进行筛选,得到目标数据集,所述目标数据集包括所述第二数据集中的部分第二数据;获取所述目标数据集中每个目标数据的数据标签,得到所述目标数据集对应的目标训练数据集;利用所述目标训练数据集,对所述第一模型进行训练,得到第二模型。本发明实施例,利用机器模型实现数据筛选,基于机器模型的筛选结果进行数据标记,能够减少监督学习过程中的数据标记需求,提高模型训练效率。
-
公开(公告)号:CN119539057A
公开(公告)日:2025-02-28
申请号:CN202411688975.8
申请日:2024-11-25
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司 , 中国移动通信集团江苏有限公司 , 南京大学
Abstract: 本申请提供一种基于动态约束强化学习的大模型安全对齐方法,所述方法包括:构建对话偏好数据集;基于所述对话偏好数据集分别对初始奖励模型和初始成本模型进行训练,得到训练好的奖励模型和训练好的成本模型;基于所述训练好的奖励模型和所述训练好的成本模型生成第一微调策略和第二微调策略;根据所述第一微调策略和/或第二微调策略对所述初始大语言模型进行更新,得到更新后的大语言模型。本申请通过构建好的对话偏好数据集分别对奖励模型和成本模型进行训练,通过训练好的奖励模型和成本模型生成第一微调策略和第二微调策略,从而对大语言模型进行更新,提高了大语言模型在安全性和有用性之间的平衡性。
-
公开(公告)号:CN116910189A
公开(公告)日:2023-10-20
申请号:CN202310217398.3
申请日:2023-03-08
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F16/332 , G06F16/35 , G06F16/36 , G06F18/22 , G06F40/30
Abstract: 本发明提供一种图谱问答方法、装置、系统及介质,所述方法包括:计算问题向量与候选向量之间的相似度,以在所述候选向量中确定目标向量,其中,所述问题向量为基于用户问题进行向量转换得到的向量,所述候选向量为基于切割后的三元组集合进行向量转换得到的向量集合,所述目标向量与所述问题向量的相似度大于所述候选向量中其他候选向量与所述问题向量的相似度;根据所述目标向量对应的三元组回答所述用户问题。这样,在计算相似度时减少了三元组中答案部分对问答的干扰,提升了图谱问答系统问答用户问题的准确率。
-
公开(公告)号:CN118821883A
公开(公告)日:2024-10-22
申请号:CN202410095266.2
申请日:2024-01-23
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06N3/08 , G06N3/0455 , G06F40/216 , G06F40/35 , G06F40/42 , G06N3/0475 , G06F40/247
Abstract: 本发明公开一种数据增强方法、装置、设备和存储介质;所述方法包括:获取第一样本数据和第二样本数据;所述第一样本数据集包括未标记的文本数据;所述第二样本数据包括已标记的文本数据;基于所述第一样本数据对网络模型进行无监督训练,并确定第一损失函数值;基于所述第二样本数据对所述网络模型进行有监督训练,并确定第二损失函数值;基于所述第一损失函数值和所述第二损失函数值,对所述网络模型的参数进行调整,得到训练后的网络模型;基于所述训练后的网络模型进行文本数据增强。
-
公开(公告)号:CN118797055A
公开(公告)日:2024-10-18
申请号:CN202410018719.1
申请日:2024-01-04
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F16/35 , G06F16/33 , G06F16/332 , G06N5/04
Abstract: 本申请公开了一种文本问答数据对的标注方法、装置、设备及存储介质。该方法包括:获取待标注的文本问答数据对,文本问答数据对包括:表征原始问题的第一文本数据和表征原始答案的第二文本数据;基于预训练的文本生成模型对第二文本数据进行处理,得到多个第三文本数据,各第三文本数据用于表征与原始问题对应的伪问题;基于预训练的第一句向量模型,将多个第三文本数据转换为第一向量,并将第一文本数据转换为第二向量;基于第一向量与第二向量之间的相似度,生成文本问答数据对的第一标注数据。可以减少长文本的回答数据受限于第一句向量模型的处理长度导致的匹配性能受损的缺陷,利于满足长文本的问答数据对的自动标注需求。
-
公开(公告)号:CN116521829A
公开(公告)日:2023-08-01
申请号:CN202210080421.4
申请日:2022-01-24
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/36
Abstract: 本申请提供了图谱问答方法及装置、设备、存储介质;所述方法包括:通过已训练的K元匹配模型,将第一查询问题作为整体进行向量化处理,得到第一向量;其中,K大于0;通过所述K元匹配模型,确定所述第一向量分别与各个候选K元组的第二向量之间的第一相似度;其中,所述第二向量通过所述K元匹配模型预先将所述候选K元组作为整体进行向量化处理得到;以及从各个所述候选K元组中选出所述第一相似度满足条件的候选K元组作为目标K元组;将所述目标K元组中的实体作为答案输出。如此,能够快速确定出问题答案,效率更高。
-
公开(公告)号:CN118796858A
公开(公告)日:2024-10-18
申请号:CN202410200026.4
申请日:2024-02-22
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F16/242 , G06F18/214 , G06F40/30
Abstract: 本申请公开了一种数据库语句生成方法,所述方法包括:确定用户的输入文本和与输入文本相关联的数据库中全部数据表的表信息;将输入文本与数据库中全部数据表的表信息输入至预训练好的大语言模型中,得到大语言模型输出的表数据集;表数据集包括一个或多个数据表名和对应的字段名,数据表名和对应的字段名与输入文本相关联;将得到的表数据集和输入文本输入至大语言模型中,得到大语言模型输出的输入文本对应的数据库语句。
-
公开(公告)号:CN116915894A
公开(公告)日:2023-10-20
申请号:CN202310188641.3
申请日:2023-03-02
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
Abstract: 本公开提供一种来电身份识别方法、装置、电子设备和可读存储介质,涉及人工智能技术领域,其中,所述方法包括:获取来电方的目标对话文本信息;将所述目标对话文本信息与预设的来电文本库中的至少一个对话文本信息进行文本匹配和/或语义匹配,得到匹配结果;根据所述匹配结果,确定所述来电方是机器人或自然人。通过获取来电方的目标对话文本信息,并根据预设的来电文本库中的至少一个对话文本信息,对所述目标对话文本信息进行文本匹配和/或语义匹配,得到用于指示来电方身份的匹配结果,进而根据匹配结果,确定来电方是机器人或自然人,以完成对来电方的自然人身份或机器人身份的识别。
-
公开(公告)号:CN119539058A
公开(公告)日:2025-02-28
申请号:CN202411689955.2
申请日:2024-11-25
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司 , 中国移动通信集团江苏有限公司 , 南京大学
Abstract: 本发明提供一种基于均衡求解的大模型对齐方法,涉及数据处理技术领域,该方法包括:获取问题数据集和预测模型,所述问题数据集包括多个问题,所述预测模型用于在不同场景下判断回应的回应效果;基于预设语言模型对所述多个问题中每个问题进行回应,得到所述每个问题对应的两个回应文本;基于所述预测模型将所述每个问题对应的两个回应文本划分为第一文本和第二文本,所述第一文本的回应效果好于所述第二文本的回应效果;基于所述每个问题对应的第一文本和第二文本构建训练数据集;基于所述训练数据集对所述预设语言模型进行训练,得到目标模型,所述目标模型用于对问题进行回应。本发明能提高语言模型输出的回应效果。
-
-
-
-
-
-
-
-
-