-
公开(公告)号:CN116312490A
公开(公告)日:2023-06-23
申请号:CN202310162683.X
申请日:2023-02-23
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了多音字发音的预测方法和装置。该方法包括:得到需要向用户播放的交互内容;将该交互内容输入预先训练的韵律预测模型中,由该韵律预测模型输出带有韵律标签的交互内容;其中,韵律标签用于指示发音时的停顿;针对该交互内容中由各韵律标签分割出的每一个内容单元,检测该内容单元中是否包括多音字,如果包括,则根据该内容单元的上下文得到被包括的该多音字在该内容单元中的发音。本说明书实施例能够使得机器设备准确地确定出多音字的发音,并提高机器设备的处理效率。
-
公开(公告)号:CN114495982A
公开(公告)日:2022-05-13
申请号:CN202210068338.5
申请日:2022-01-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G10L25/51 , G10L15/26 , G10L15/04 , G10L21/0272
Abstract: 本说明书实施例提供了一种风险检测方法、装置及设备,所述方法包括:获取待检测的目标语音流,并对所述目标语音流进行说话人分离处理,确定所述目标语音流对应的说话人信息;基于所述说话人信息,将所述目标语音流分割成与说话人对应的多个目标语音片段,并对所述目标语音片段进行文本转换处理,得到对应的目标文本数据;基于预先构建的风险文本库中的风险文本数据,对所述目标文本数据进行风险检测,得到针对所述目标语音片段的风险检测结果;基于所述说话人信息和所述目标文本数据的风险检测结果,确定所述目标语音流是否为存在风险的语音流。
-
公开(公告)号:CN116504268A
公开(公告)日:2023-07-28
申请号:CN202310447588.4
申请日:2023-04-13
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书公开了一种业务风控的方法、装置、存储介质以及电子设备,用于隐私保护,将各用户在执行业务时的各语音数据输入到预设的声纹特征模型中,以提取出每个语音数据的声纹特征。将每个语音数据的声纹特征以及每个语音数据对应的第一关联相似度输入到预设的聚类模型中,以对各声纹特征进行聚类,得到各初始聚类簇。针对每个语音数据,确定该语音数据的声纹特征相匹配的初始聚类簇,作为目标簇,从目标簇中确定出第二关联声纹特征,并确定该语音数据对应的第二关联相似度。根据每个语音数据对应的第二关联相似度,调整初始聚类结果,得到最终聚类结果,判断是否存在归属于同一聚类簇但出自不同用户账户的语音数据,根据判断结果,执行业务风控。
-
公开(公告)号:CN119170051A
公开(公告)日:2024-12-20
申请号:CN202411217063.2
申请日:2024-08-30
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种语音的防伪攻击检测方法、装置及设备,该方法包括:获取待检测的语音数据;将所述语音数据输入到语音防伪攻击检测模型中的由多个编码块串联构成的第一编码子模型中,获取每个编码块输出的语音编码信息;基于所述多个编码块中每个编码块输出的语音编码信息,通过所述语音识别模型中的语音处理子模型对所述语音数据进行防伪攻击检测处理,得到所述语音数据对应的检测结果。
-
公开(公告)号:CN118969016A
公开(公告)日:2024-11-15
申请号:CN202410853569.6
申请日:2024-06-27
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G10L25/51 , G10L25/57 , G10L25/30 , G10L15/16 , G10L15/26 , G06F18/213 , G06F18/214 , G06F18/22
Abstract: 本说明书实施例公开了一种语音模型训练方法、装置、存储介质及电子设备,首先分别利用语音模型和文本模型对训练样本集中的训练样本进行特征提取,得到训练样本对应的样本音频特征和样本文本特征;然后根据训练样本集中训练样本的样本音频特征和样本音频的音频类别信息,生成分类损失值,分类损失值表征音频类别信息和实际类别信息之间的差异;然后根据训练样本集中训练样本的样本音频特征和样本文本特征,生成相似度损失值,相似度损失值表征样本音频特征和样本文本特征之间的相似度;最后根据分类损失值和相似度损失值,调整语音模型和文本模型的参数。
-
公开(公告)号:CN115062691B
公开(公告)日:2024-09-06
申请号:CN202210581712.1
申请日:2022-05-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例描述了属性识别方法和装置。根据实施例的方法,首先获取来自至少两个模态的用于对属性进行识别的原始数据,然后分别针对每种模态的原始数据进行属性特征的挖掘。进一步,将得到的各个模态的属性特征进行融合后,即可根据融合后的融合特征得到属性的识别结果。本方案是通过将不同模态的数据进行融合来实现对属性的识别,如此能够充分吸取各个模态的数据对属性进行识别的优势,不会遗漏某些对属性识别有利的信息,从而能够提高属性识别的准确性。
-
公开(公告)号:CN118098215A
公开(公告)日:2024-05-28
申请号:CN202410327948.1
申请日:2024-03-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G10L15/06 , G10L19/022
Abstract: 本说明书实施例公开了一种音频识别模型训练方法、装置、存储介质及电子设备,首先获取训练样本,分别将样本音频和样本音频的关联文本输入语音模型和文本模型,得到样本音频特征和样本文本特征;之后,对样本音频特征和样本文本特征进行融合,得到融合特征;在此基础上,根据融合特征生成实际类别信息,根据音频类别信息和实际类别信息,调整语音模型和文本模型的参数。
-
公开(公告)号:CN115062691A
公开(公告)日:2022-09-16
申请号:CN202210581712.1
申请日:2022-05-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例描述了属性识别方法和装置。根据实施例的方法,首先获取来自至少两个模态的用于对属性进行识别的原始数据,然后分别针对每种模态的原始数据进行属性特征的挖掘。进一步,将得到的各个模态的属性特征进行融合后,即可根据融合后的融合特征得到属性的识别结果。本方案是通过将不同模态的数据进行融合来实现对属性的识别,如此能够充分吸取各个模态的数据对属性进行识别的优势,不会遗漏某些对属性识别有利的信息,从而能够提高属性识别的准确性。
-
公开(公告)号:CN116844553B
公开(公告)日:2024-07-09
申请号:CN202310651826.3
申请日:2023-06-02
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,其中,该方法包括:接收待检测的目标音频数据,通过预先训练的检测模型对目标音频数据进行频谱提取处理,得到与目标音频数据对应的目标频谱数据,并通过预先训练的检测模型对目标频谱数据进行音频合成处理,得到与目标音频数据对应的合成音频数据,通过预先训练的检测模型分别对目标音频数据和合成音频数据进行声纹提取处理,得到与目标音频数据对应的第一声纹特征向量,以及与合成音频数据对应的第二声纹特征向量,基于第一声纹特征向量和第二声纹特征向量之间的相似度,对目标音频数据为合成数据或非合成数据进行判断,得到针对目标音频数据的检测结果。
-
公开(公告)号:CN116844553A
公开(公告)日:2023-10-03
申请号:CN202310651826.3
申请日:2023-06-02
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,其中,该方法包括:接收待检测的目标音频数据,通过预先训练的检测模型对目标音频数据进行频谱提取处理,得到与目标音频数据对应的目标频谱数据,并通过预先训练的检测模型对目标频谱数据进行音频合成处理,得到与目标音频数据对应的合成音频数据,通过预先训练的检测模型分别对目标音频数据和合成音频数据进行声纹提取处理,得到与目标音频数据对应的第一声纹特征向量,以及与合成音频数据对应的第二声纹特征向量,基于第一声纹特征向量和第二声纹特征向量之间的相似度,对目标音频数据为合成数据或非合成数据进行判断,得到针对目标音频数据的检测结果。
-
-
-
-
-
-
-
-
-