基于情绪识别的伪造音频检测方法

    公开(公告)号:CN117059131A

    公开(公告)日:2023-11-14

    申请号:CN202311324794.2

    申请日:2023-10-13

    Inventor: 陈卓越 丁卓 鲁宁

    Abstract: 本发明涉及音频分析技术领域,具体涉及一种基于情绪识别的伪造音频检测方法;建立语音情绪识别系统,建立合成语音检测系统,使用语音情绪识别系统和合成语音检测系统对伪造音频进行检测,在建立语音情绪识别系统的步骤中:选择情感语音语料库,进行语音输入的预处理和转换,从语音中提取情感特定特征,使用分类模型来识别情感,在建立合成语音检测系统的步骤中:合成语音检测系统由二值分类器组成,以特征向量Fx作为输入,估计输入信号所属的类别,使用标准的34层残差网络,使用多头注意力池来学习假音频和欺骗检测的判别嵌入,利用神经拼接来提高模型的泛化能力,通过上述方式,实现更加全面地检测伪造音频。

    基于大数据自监督的声纹识别模型训练方法、系统

    公开(公告)号:CN115472167A

    公开(公告)日:2022-12-13

    申请号:CN202210986290.6

    申请日:2022-08-17

    Abstract: 本方案涉及一种基于大数据自监督的声纹识别模型训练方法、系统。所述方法包括:各个分布式主机获取多源录音数据进行分布式存储,并对录音数据进行数据清洗,得到带标签的录音数据以及未带标签的录音数据;各个分布式主机对带标签的录音数据以及未带标签的录音数据切片处理,分别向切片处理后的录音数据加入噪声干扰,得到样本对并输入到自监督学习模型中,与服务器进行联邦学习模型训练,在服务器上训练得到声纹识别基础模型;服务器基于带标签的录音数据对基础模型的模型参数进行监督学习精调,得到声纹识别精调模型。采用横向联邦学习由服务器统筹存储在不同分布式主机上的多源数据用于声纹识别模型的大规模训练,可实现海量数据模型训练。

    一种基于多源交互融合的图表示学习方法

    公开(公告)号:CN114756713A

    公开(公告)日:2022-07-15

    申请号:CN202210267016.3

    申请日:2022-03-17

    Abstract: 本发明公开一种基于多源交互融合的图表示学习方法,包括如下步骤:提取图结构形式的网络中的节点属性、节点类别以及节点之间的邻接关系;采用基于BFS、DFS的元路径高阶邻域节点采样算法分别得到BFS和DFS高阶邻域节点集;通过一阶邻域信息聚合算法获取节点的一阶邻域信息;通过异质高阶邻域信息聚合算法获取节点的高阶领域信息;利用基于门控神经网络的多源信息融合模型将节点的自身信息、节点的高阶邻域信息以及一阶邻域信息进行融合得到节点的多源交互融合信息作为最终的向量表示;在多任务优化函数下对算法模型的参数进行优化。本发明提升了对元路径内节点信息提取能力,同时大大增强了对不同层次邻域信息的捕捉能力。

    用于电话语音识别的信息处理方法及装置

    公开(公告)号:CN117765951B

    公开(公告)日:2024-11-08

    申请号:CN202311224332.3

    申请日:2023-09-21

    Inventor: 赵胜 丁卓

    Abstract: 本申请公开了一种用于电话语音识别的信息处理方法及装置,其中方法包括获取非电话信道语音数据,并对所述非电话信道语音数据进行随机速度扰动,得到第一语音数据;对所述第一语音数据添加噪声和混响数据,得到第二语音数据;对所述第二语音数据进行音频降采样,并将降采样后的数据进行电话信道传输模拟,得到第三语音数据;基于所述第三语音数据,对预设的声纹识别用模型进行训练,以作为训练样本对所述预设的声纹识别用模型进行训练。通过特定的数据增强方式得到的数据用于声纹识别系统模型训练,实现少数据量情况下的电话信道声纹识别模型的训练,进而克服了在没有真实的电话数据可用的情况下将难以针对电话数据实施模型的训练的问题。

    基于大数据自监督的声纹识别模型训练方法、系统

    公开(公告)号:CN115472167B

    公开(公告)日:2024-11-01

    申请号:CN202210986290.6

    申请日:2022-08-17

    Abstract: 本方案涉及一种基于大数据自监督的声纹识别模型训练方法、系统。所述方法包括:各个分布式主机获取多源录音数据进行分布式存储,并对录音数据进行数据清洗,得到带标签的录音数据以及未带标签的录音数据;各个分布式主机对带标签的录音数据以及未带标签的录音数据切片处理,分别向切片处理后的录音数据加入噪声干扰,得到样本对并输入到自监督学习模型中,与服务器进行联邦学习模型训练,在服务器上训练得到声纹识别基础模型;服务器基于带标签的录音数据对基础模型的模型参数进行监督学习精调,得到声纹识别精调模型。采用横向联邦学习由服务器统筹存储在不同分布式主机上的多源数据用于声纹识别模型的大规模训练,可实现海量数据模型训练。

    一种身份加密的情感语音合成方法及系统

    公开(公告)号:CN118571266A

    公开(公告)日:2024-08-30

    申请号:CN202410851231.7

    申请日:2024-06-28

    Inventor: 赵胜 丁卓 潘友健

    Abstract: 本发明涉及语音合成技术领域,具体涉及一种身份加密的情感语音合成方法及系统;包括输入模块、语音特征提取模块、情感分析模块、文本转换模块、语音合成模块、加密处理模块和输出模块,情感分析模块用于根据声学特征识别出用户的情感倾向,得到情感分析结果;文本转换模块用于分别将情感分析结果、原始语音数据进行文本转换,分别得到情感分析文本数据、原始语音文本数据;语音合成模块用于将情感分析文本数据、原始语音文本数据转换为合成语音;加密处理模块用于对合成语音进行加密;通过上述方式,实现在保留语音自然度和表达丰富性的同时,保证语音消息隐私安全。

    一种基于威胁情报的复杂命名实体识别方法

    公开(公告)号:CN117236333B

    公开(公告)日:2024-08-09

    申请号:CN202311339881.5

    申请日:2023-10-17

    Abstract: 本发明涉及信息安全技术领域,具体涉及一种基于威胁情报的复杂命名实体识别方法,包括:从不同专门收集威胁情报的网站获取CTI报告,对获取到的数据进行数据清洗,并构建训练模型的数据集;使用预训练模型RoBERT和BiLSTM获取句子中的词级的向量表示和字符级的向量表示,并将获取到的特征进行拼接;利用CBAM注意力机制和空洞卷积融合实体特征,并使用MLP预测词对关系分数,使用解码器获取最终的识别结果;使用AEDA方法进行数据增强;利用Label Smoothing方法使训练数据标签平滑化;使用训练好的模型对获取的数据进行实体检测;本发明解决了现有的威胁情报实体识别方法难以对威胁情报不规则实体进行准确识别,以及对中英混合实体识别困难的问题。

    一种多模态身份验证系统及方法
    18.
    发明公开

    公开(公告)号:CN118245994A

    公开(公告)日:2024-06-25

    申请号:CN202410425927.3

    申请日:2024-04-10

    Inventor: 赵胜 丁卓 贺东海

    Abstract: 本发明涉及身份验证技术领域,具体涉及一种多模态身份验证系统及方法;包括声纹识别模块、唇语识别模块、人脸识别模块、活体检测模块、数字语音密码锁模块、数据整合模块和结果评估模块,声纹识别模块用于分析用户个体的声音特征,进行身份验证;唇语识别模块用于识别说话内容;人脸识别模块用于识别和验证个体身份;活体检测模块用于判断是否为真实的人类面部;数字语音密码锁模块用于分析语音信号中的数字内容和说话者的声音特征验证身份;数据整合模块用于融合声纹、唇语、人脸及数字语音密码;结果评估模块用于对融合结果进行评估,通过上述方式,实现身份验证中更加稳健和可靠的验证过程,提高身份验证的安全性能。

    基于哈希加密的声纹认证隐私保护方法

    公开(公告)号:CN116055061B

    公开(公告)日:2024-03-05

    申请号:CN202310058677.X

    申请日:2023-01-18

    Inventor: 张星东 赵胜 丁卓

    Abstract: 基于哈希加密的声纹认证隐私保护方法,对提取的声纹特征向量进行处理,生成二进制哈希声纹特征向量,通过随机投影然后带量化将得到的二进制哈希特征向量转换为位序列,生成哈希串特征向量q1,并将其保存到服务端。提取待验证语音音频数据的声纹特征向量,对声纹特征向量进行处理,生成二进制哈希声纹特征向量,通过随机投影然后带量化将得到的二进制哈希特征向量转换为位序列,生成哈希串特征向量q2;由哈希串特征向量q2与服务端哈希串特征向量q1进行匹配,计算q2于q1的汉明距离,得到决策结果,如完全匹配则认证,若否则拒绝。解决了声纹特征不被他人利用、泄露或篡改,保护使用者隐私的难题。

Patent Agency Ranking