-
公开(公告)号:CN118966299A
公开(公告)日:2024-11-15
申请号:CN202410859925.5
申请日:2024-06-28
Applicant: 清华大学 , OPPO广东移动通信有限公司
Abstract: 本发明提供一种大语言模型安全对齐训练方法、装置、电子设备及介质,涉及人工智能领域。该方法包括:收集有害数据集并添加到训练数据中,有害数据集中的每个元素包括有害问题及与有害问题对应的有害回答;统计目标大语言模型被训练前生成有害问题生成对应的有害回答的概率;利用训练数据对目标大语言模型进行迭代训练;在每轮迭代完成后统计目标大语言模型生成有害问题及对应的有害回答的概率;基于统计的概率计算第一损失;利用第一损失的梯度对目标大语言模型的参数进行优化,并返回利用训练数据对目标大语言模型进行迭代训练的步骤直至迭代训练完成。本发明的方案能够让大语言模型充分遗忘有害知识,提升模型泛化能力。
-
公开(公告)号:CN110659366A
公开(公告)日:2020-01-07
申请号:CN201910902505.X
申请日:2019-09-24
Applicant: OPPO广东移动通信有限公司
Inventor: 杨振宇
Abstract: 本申请公开了一种语义解析方法、装置、电子设备以及存储介质,涉及电子设备技术领域。所述方法包括:获取待查询语句,对待查询语句进行实体识别,获取待查询语句中的目标实体,将目标实体与知识图谱进行实体链接,获得与目标实体对应的实体内容,基于实体内容对待查询语句进行意图分析,获得与待查询语句对应的至少一个意图分类。本申请实施例提供的语义解析方法、装置、电子设备以及存储介质通过先定位目标实体,通过实体链接从知识图谱中获取目标实体对应的实体内容,再对实体内容进行意图分析获得至少一个意图分类,从而解决过召回的问题以及实现支持媒体垂域知识问答的效果。
-
公开(公告)号:CN112069301B
公开(公告)日:2024-07-02
申请号:CN202010953728.1
申请日:2020-09-11
Applicant: 深圳市欢太科技有限公司 , OPPO广东移动通信有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06F40/279
Abstract: 本申请公开了一种意图识别方法、装置、服务器及存储介质,该意图识别方法包括:在识别目标用户的待识别语句获得多类媒体资源的意图时,获取多类媒体资源的意图中每类媒体资源的意图的资源热度得分;基于目标用户对应的每类媒体资源的应用的应用数据,获取每类媒体资源的意图对应的使用习惯得分;基于每类媒体资源的意图的资源热度得分,以及每类媒体资源的意图对应的使用习惯得分,确定每类媒体资源的意图对应的意图得分;从多类媒体资源的意图中获取意图得分满足预设得分条件的意图,作为待识别语句对应的目标意图。本方法可以实现在识别到多类媒体资源的意图时,参考媒体资源的热度以及用户习惯确定最终的识别意图,提升意图识别的准确性。
-
公开(公告)号:CN117874751A
公开(公告)日:2024-04-12
申请号:CN202311576697.2
申请日:2023-11-23
Applicant: 清华大学 , OPPO广东移动通信有限公司
Abstract: 本发明提供一种安全检测方法、装置、电子设备及可读存储介质,其中的方法包括:获取待检测文本;获取用户端对待检测文本的子任务检测指令;基于预先训练的安全检测模型,根据待检测文本的子任务检测指令,对待检测文本进行安全检测,得到安全检测结果;其中,安全检测模型通过根据训练样本数据集进行训练优化得到,以及,安全检测模型包括多个安全检测子任务模块。该方法通过包括多个安全检测子任务模块的安全检测模型对待检测文本进行安全检测,能够用于检测各种文本的安全性,克服了现有安全检测方法通用性不高、解释性不强且检测准确度低的缺陷,实现了更加准确、全面的检测性能。
-
公开(公告)号:CN117851584A
公开(公告)日:2024-04-09
申请号:CN202410020385.1
申请日:2024-01-05
Applicant: OPPO广东移动通信有限公司
IPC: G06F16/34 , G06F18/214 , G06F40/205 , G06F40/30
Abstract: 本申请提供了一种摘要生成模型的训练方法、摘要生成方法、装置及设备,属于计算机技术领域。该方法由计算机设备执行,方法包括:获取样本通话记录;通过自然语言处理模型,基于引导文本,对样本通话记录进行处理,得到第一摘要;基于样本通话记录和第一摘要,对摘要生成模型进行训练,以使摘要生成模型能够对通话记录进行处理以生成通话记录的摘要。上述技术方案能够使得摘要生成模型具备生成细粒度的通话记录摘要的能力,也即是,摘要生成模型能够以通话记录中的任一通话对象为主语,生成包含多个摘要属性的摘要,从而保证了摘要中包含通话记录中的关键内容,提高了生成的摘要的全面度和准确度。
-
公开(公告)号:CN112069301A
公开(公告)日:2020-12-11
申请号:CN202010953728.1
申请日:2020-09-11
Applicant: 深圳市欢太科技有限公司 , OPPO广东移动通信有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06F40/279
Abstract: 本申请公开了一种意图识别方法、装置、服务器及存储介质,该意图识别方法包括:在识别目标用户的待识别语句获得多类媒体资源的意图时,获取多类媒体资源的意图中每类媒体资源的意图的资源热度得分;基于目标用户对应的每类媒体资源的应用的应用数据,获取每类媒体资源的意图对应的使用习惯得分;基于每类媒体资源的意图的资源热度得分,以及每类媒体资源的意图对应的使用习惯得分,确定每类媒体资源的意图对应的意图得分;从多类媒体资源的意图中获取意图得分满足预设得分条件的意图,作为待识别语句对应的目标意图。本方法可以实现在识别到多类媒体资源的意图时,参考媒体资源的热度以及用户习惯确定最终的识别意图,提升意图识别的准确性。
-
公开(公告)号:CN112115244B
公开(公告)日:2024-05-03
申请号:CN202010847014.2
申请日:2020-08-21
Applicant: 深圳市欢太科技有限公司 , OPPO广东移动通信有限公司
Inventor: 杨振宇
IPC: G06F16/332 , G06F16/33 , G06F40/30 , G06N20/00
Abstract: 本申请实施例公开了一种对话交互方法、装置、存储介质及电子设备,属于计算机技术领域。所述方法应用于内置有预设对话模型的电子设备,电子设备根据第一交互结果分析第一用户的交互满意度,第一交互结果为预设对话模型对第一用户输入的语音数据输出的交互结果,在交互满意度小于或等于预设阈值时,向服务器发送语音数据,并接收由服务器发送的与语音数据对应的交互指令,将交互指令与语音数据作为样本数据对预设对话模型进行优化训练,通过服务器搜索语音数据对应的答案数据的方式,获取用于优化训练预设对话模型的新样本数据,从而减少人工参与的工作量,并使得对预设对话模型进行优化训练的过程更加智能化。
-
公开(公告)号:CN112115244A
公开(公告)日:2020-12-22
申请号:CN202010847014.2
申请日:2020-08-21
Applicant: 深圳市欢太科技有限公司 , OPPO广东移动通信有限公司
Inventor: 杨振宇
IPC: G06F16/332 , G06F16/33 , G06F40/30 , G06N20/00
Abstract: 本申请实施例公开了一种对话交互方法、装置、存储介质及电子设备,属于计算机技术领域。所述方法应用于内置有预设对话模型的电子设备,电子设备根据第一交互结果分析第一用户的交互满意度,第一交互结果为预设对话模型对第一用户输入的语音数据输出的交互结果,在交互满意度小于或等于预设阈值时,向服务器发送语音数据,并接收由服务器发送的与语音数据对应的交互指令,将交互指令与语音数据作为样本数据对预设对话模型进行优化训练,通过服务器搜索语音数据对应的答案数据的方式,获取用于优化训练预设对话模型的新样本数据,从而减少人工参与的工作量,并使得对预设对话模型进行优化训练的过程更加智能化。
-
-
-
-
-
-
-