分布式声纹检索方法及系统
    61.
    发明公开

    公开(公告)号:CN115357751A

    公开(公告)日:2022-11-18

    申请号:CN202211021152.0

    申请日:2022-08-24

    Abstract: 本方案涉及一种分布式声纹检索方法及系统。所述方法包括:中心服务器训练声纹编码器并发给各个分布式存储端;各个分布式存储端构建本地声纹底库,并构建底库矩阵;中心服务器接收声纹查询数据,并根据声纹查询数据构建查询矩阵并广播至各个分布式存储端;各个分布式存储端接收查询矩阵,根据查询矩阵与底库矩阵进行声纹检索计算,得到打分矩阵并发送给中心服务器;中心服务器根据打分矩阵确定与声纹查询数据对应的说话人声纹检索结果。通过将声纹底库数据采用分布式存储的方式存储在各个存储端中,并通过查询矩阵和打分矩阵进行声纹查询,当存在大规模检索数据时,通过分布式存储端进行辅助声纹查询可以提高声纹检索的效率。

    基于异构图神经网络的反诈骗方法、系统、计算机设备

    公开(公告)号:CN114579991A

    公开(公告)日:2022-06-03

    申请号:CN202210156646.3

    申请日:2022-02-21

    Inventor: 张星东 丁卓

    Abstract: 本方案涉及一种基于异构图神经网络的反诈骗方法、系统、计算机设备及存储介质。所述方法包括:获取各方传输的加密后的用户数据,解密处理用户数据,得到目标用户数据;对目标用户数据进行数据融合处理并建立异构图,并根据异构图计算同一时间段内各个用户的活动数;根据异构图构建用户图表,并根据活动数对用户图表进行用户清理,得到目标用户图表;将目标用户图表作为输入,通过图神经网络模型进行卷积计算输出用户评分,并根据用户评分确定诈骗风险。由于获取的是各方传输的用户数据,使得数据来源丰富;通过建立异构图、图神经网络模型得到用户评分,从而确定诈骗风险,运营商等机构可以根据诈骗风险作出对应的反诈骗处理。

    电话卡冒用检测方法、系统、计算机设备及存储介质

    公开(公告)号:CN113763963B

    公开(公告)日:2025-02-18

    申请号:CN202110974150.2

    申请日:2021-08-24

    Abstract: 本方案涉及一种电话卡冒用检测方法、系统、计算机设备及存储介质。所述方法包括:获取包含有疑似被冒用电话卡的电话号码的嫌疑名单;获取与电话号码对应机主的电话录音,并通过重采样算法将电话录音的采集频率调整为目标采集频率;将含有目标采集频率的电话录音输入至声纹识别算法模型中,得到与电话录音对应的声纹特征;在注册录音底库中查找与电话号码对应的注册声纹特征;将声纹特征与注册声纹特征进行比对,得到比对结果,并根据比对结果确定电话号码对应的电话卡是否被冒用。通过对采集的电话录音以及数据库中的目标电话录音进行声纹识别,从而根据声纹识别结果确定电话录音对应的机主是否为注册机主,可以准确检测出电话卡是否被冒用。

    基于多模态数据融合的环境音事件检测方法

    公开(公告)号:CN119446154A

    公开(公告)日:2025-02-14

    申请号:CN202411562113.0

    申请日:2024-11-05

    Inventor: 赵胜 丁卓

    Abstract: 本发明涉及环境音事件检测技术领域,具体涉及一种基于多模态数据融合的环境音事件检测方法,利用麦克风阵列、摄像头和传感器同步采集音频、视频及环境数据,形成多模态数据源。对采集到的多模态数据进行预处理,以提高数据质量和后续分析的准确性。从处理后的数据中提取关键特征,并将这些特征进行融合,形成多模态特征。构建深度学习模型,并使用多模态特征进行训练,以获得能够识别环境音事件的模型。将训练后的模型进行剪枝、量化和知识蒸馏等优化,部署在边缘设备上,实现实时的初步特征提取和事件检测。解决了现有技术中环境音事件检测方法存在的鲁棒性差、实时性不高以及泛化能力有限的问题。

    基于选择性扫描视觉状态空间模型的视频序列分割方法

    公开(公告)号:CN119206568A

    公开(公告)日:2024-12-27

    申请号:CN202411238187.9

    申请日:2024-09-05

    Inventor: 丁建睿 张听 丁卓

    Abstract: 本发明涉及深度学习语义分割技术领域,尤其涉及一种基于选择性扫描视觉状态空间模型的视频序列分割方法,将图像序列输入到重叠特征块划分层,将输入图像序列划分为图像特征块序列;将图像特征块序列输入到基于选择性扫描视觉的状态空间模型编码器中提取不同尺度上的粗细特征序列;将不同尺度上的粗细特征序列输入到多层感知机层进行多级特征的有效融合得到特征序列;将特征序列输入到基于卷积神经网络的轻量级解码头预测分割掩码,并进行视觉可视化生成语义分割图;以此方式解决了现有技术中传统的卷积神经网络接受范围有限,并且基于自注意力的网络在构建长期依赖方面具有极高的计算复杂度,从而导致图像序列分割效果差的技术问题。

    一种基于分贝和能量值转换的音频分析方法及系统

    公开(公告)号:CN119028371A

    公开(公告)日:2024-11-26

    申请号:CN202410969187.X

    申请日:2024-07-19

    Inventor: 谢羽凯 丁卓

    Abstract: 本发明涉及音频分析技术领域,具体涉及一种基于分贝和能量值转换的音频分析方法及系统;音频信号预处理模块用于接收音频信号,并对音频信号进行预处理,去除音频信号中的噪声,得到音频处理信号;分贝值计算模块用于计算音频处理信号中的SPL值,提取分贝值;能量值提取模块用于计算每帧音频处理信号的短时能量值;转换融合模块用于融合分贝值和能量值,对音频信号中的关键信息进行整合和提炼;通过将分贝值和能量值的分析相结合,实现对音频信号更为全面和深入的分析,不仅能够提高音频分析的准确性和可靠性,而且能够在保证实时性的同时减少资源消耗。

    一种基于循环生成对抗网络的图像风格迁移方法

    公开(公告)号:CN117994122B

    公开(公告)日:2024-11-26

    申请号:CN202410135881.1

    申请日:2024-01-31

    Inventor: 郑宇力 丁卓

    Abstract: 本发明涉及计算机视觉技术领域,具体涉及一种基于循环生成对抗网络的图像风格迁移方法;将风格A的图像集和风格B的图像集共同作为训练集,两种风格的图像集分别把对方的风格作为迁移目标,构建一个用于判断图像的风格和是否经过迁移的判别器,两个用于进行风格迁移的生成器;利用推土机距离和梯度惩罚更新判别器,利用循环一致性损失、一致性损失和两个生成器损失更新生成器;通过推土机距离收敛与否判断训练进程;通过实际生成的效果图来调整多优化目标的损失函数的超参数;本发明改善了循环生成对抗网络训练的稳定性,使得训练进程可视化,有效降低了模型训练的难度,可以用于不同数据集的图像风格迁移任务。

    一种基于改进ESPRIT算法的宽带信号DOA估计方法

    公开(公告)号:CN118859102A

    公开(公告)日:2024-10-29

    申请号:CN202410837357.9

    申请日:2024-06-26

    Abstract: 本发明提出了一种基于改进ESPRIT算法的宽带信号DOA估计方法,将ESPRIT算法所需的阵元偶麦克风阵列通过麦克风复用简化为均匀线阵;并针对阵列位移矢量大于信号最小半波长时出现的相位卷绕问题,在用窄带ESPRIT算法估计宽带信号声源DOA的任务上给出了基于聚类的解卷绕方案。以开始出现相位卷绕的频率点为界限,将整个频带分为两部分。统计无相位卷绕的部分频率点信号DOA估计结果作为聚类中心的初始值,利用先验聚类中心对应的方向角引导存在相位卷绕的部分频率点信号进行相位解卷绕,从而避免拓展孔径阵列对中高频率信号DOA估计造成的误差,实现全频带的无相位卷绕DOA估计。该方法使得麦克风阵列能够藉由拓展阵列孔径获得更准确的估计结果。

    一种基于局部差异信息辅助的小样本类增量音频分类方法

    公开(公告)号:CN118366475A

    公开(公告)日:2024-07-19

    申请号:CN202410415397.4

    申请日:2024-04-08

    Abstract: 本发明公开了一种基于局部差异信息辅助的小样本类增量音频分类方法,本发明包括计算模块预训练阶段和分类器融合阶段,将音频分类数据集样本按照类别划分为基类、伪新类和新类,这三个类别互不重叠;所述计算模块预训练阶段为训练特征提取网络,基类分类器和小样本分类权重生成器;所述分类器融合阶段为:从基类中选取每个类别的代表性样本与新类样本混合得到混合样本,将基类分类器与新类分类器级联输入到知识保存模块中,基于混合样本训练知识保存模块,输出能够同时识别基类和新类的统一分类器。本发明改善了相似的新类与基类之间的混淆问题,提高了模型同时识别基类和新类的准确率。

    基于深度学习的动态知识库客服交互系统

    公开(公告)号:CN118332141A

    公开(公告)日:2024-07-12

    申请号:CN202410759486.0

    申请日:2024-06-13

    Inventor: 赵胜 丁卓 潘焕平

    Abstract: 本发明涉及计算机技术领域,具体涉及一种基于深度学习的动态知识库客服交互系统;包括多模态输入模块、多模态信息处理模块、语音处理模块、更新模块、行为分析与预测模块和服务响应模块,多模态信息处理模块用于处理和分析多模态输入数据,识别用户的需求和情绪;语音处理模块用于语音识别和情感分析;行为分析与预测模块用于分析用户交互行为和反馈,预测用户的需求和偏好;更新模块用于根据接收数据动态更新知识库内容;服务响应模块用于综合各个模块的分析和处理数据,生成用户需求响应,并进行呈现;通过上述方式,能够更准确地理解、响应用户需求,实时学习和进化,以不断提升服务质量和效率。

Patent Agency Ranking