-
公开(公告)号:CN119514721A
公开(公告)日:2025-02-25
申请号:CN202411429655.0
申请日:2024-10-14
Applicant: 北京邮电大学
Abstract: 本申请提供一种语言模型的训练方法、装置、设备及存储介质,该方法包括:根据语言模型的预训练矩阵,确定第一矩阵、第二矩阵以及第三矩阵;确定第二矩阵的第一缩放向量以及第三矩阵的第二缩放向量;响应于第二矩阵的范数大于或等于第三矩阵的范数,确定第二矩阵与第二缩放向量为目标训练矩阵;获取训练文本以及训练文本的实际答复结果;将训练文本输入到目标训练矩阵,得到预测答复结果;根据预测答复结果和实际答复结果,确定结果误差;基于结果误差,训练目标训练矩阵,得到优化后的语言模型。本申请通过奇异值分解算法减少语言模型的训练参数,降低了模型的复杂度和计算成本。
-
公开(公告)号:CN119722094A
公开(公告)日:2025-03-28
申请号:CN202411592442.X
申请日:2024-11-08
Applicant: 北京邮电大学
IPC: G06Q30/018 , G06N3/045 , G06N5/04 , G06F16/951 , G06F16/215 , G06F16/25 , G06F16/353
Abstract: 本公开提供一种诈骗信息识别方法、装置、电子设备、存储介质及程序产品,该方法包括:获取诈骗宣传描述信息;对诈骗宣传描述信息进行分析,得到分析结果;基于分析结果,构建提示词;基于第一大语言模型对提示词进行测试,得到测试结果,基于测试结果对提示词进行优化,得到优化后提示词;基于第二大语言模型对优化后提示词进行推理,生成诈骗信息样本;获取待识别信息,将待识别信息输入诈骗信息识别模型,得到诈骗信息识别模型输出的诈骗信息识别结果,其中,诈骗信息识别模型基于诈骗信息样本训练得到。本公开利用大语言模型实现诈骗样本的自动化生成,提升了反诈骗技术应对新型诈骗手段的效率性和准确性。
-
公开(公告)号:CN119719375A
公开(公告)日:2025-03-28
申请号:CN202411592434.5
申请日:2024-11-08
Applicant: 北京邮电大学
IPC: G06F16/353 , G06F40/30 , G06F40/216 , G06F40/284 , G06F40/289 , G06N3/045 , G06N3/0475 , G06N3/094
Abstract: 本公开提供一种基于自然语言处理的目标事件检测方法及相关设备。该方法包括:获取待检测事件的事件数据;基于训练好的目标事件模型对所述事件数据进行检测,确定所述待检测事件为目标事件;其中,训练好的所述目标事件模型基于关于目标事件的训练文本数据训练得到,包括:获取所述训练文本数据,所述训练文本数据标注有目标事件的事件类型和目标特征;对所述训练文本数据进行数据预处理和数据增强,得到增强文本数据;基于历史文本数据和所述增强文本数据对自然语言处理模型进行训练,得到训练好的所述目标事件模型。
-
-