一种面向实时语音通讯的丢包补偿方法

    公开(公告)号:CN116248229A

    公开(公告)日:2023-06-09

    申请号:CN202211572689.6

    申请日:2022-12-08

    Abstract: 本发明公开一种面向实时语音通讯的丢包补偿方法,包括如下步骤:构建基于对抗神经网络的补偿训练模型,所述补偿训练模型包括补偿系数生成器、谐波组和逼真度判别器;将历史音频输入至所述补偿系数生成器和谐波组中处理,获得初始修补音频;通过所述逼真度判别器计算初始修补音频与所述历史音频所对应的无丢包真实音频之间的相似度;基于相似度,更新补偿训练模型的参数,继续训练,直到模型收敛或达到最大迭代次数,输出当前的补偿系数生成器和谐波组作为训练好的丢包补偿模型。本发明能够更加准确地预测出丢失的音频帧,提高实时语音通讯中的音频质量。

    基于哈希加密的声纹认证隐私保护方法

    公开(公告)号:CN116055061A

    公开(公告)日:2023-05-02

    申请号:CN202310058677.X

    申请日:2023-01-18

    Abstract: 基于哈希加密的声纹认证隐私保护方法,对提取的声纹特征向量进行处理,生成二进制哈希声纹特征向量,通过随机投影然后带量化将得到的二进制哈希特征向量转换为位序列,生成哈希串特征向量q1,并将其保存到服务端。提取待验证语音音频数据的声纹特征向量,对声纹特征向量进行处理,生成二进制哈希声纹特征向量,通过随机投影然后带量化将得到的二进制哈希特征向量转换为位序列,生成哈希串特征向量q2;由哈希串特征向量q2与服务端哈希串特征向量q1进行匹配,计算q2于q1的汉明距离,得到决策结果,如完全匹配则认证,若否则拒绝。解决了声纹特征不被他人利用、泄露或篡改,保护使用者隐私的难题。

    一种基于语音识别技术的智能安防系统

    公开(公告)号:CN115083417A

    公开(公告)日:2022-09-20

    申请号:CN202210658453.8

    申请日:2022-06-11

    Inventor: 张星东 丁卓

    Abstract: 本发明属于安防系统技术领域,尤其为一种基于语音识别技术的智能安防系统,包括语音识别单元、人脸识别单元、动作识别单元和中央处理系统,所述人脸识别单元用于实时采集目标环境周围的图像信息,提取图像信息中的人脸图像特征,将提取到的人脸图像特征数据与人脸库中存储的人脸特征数据进行匹配,进行人脸识别;所述中央处理系统用于将语音识别数据及结果、人脸识别数据及结果和动作识别数据及结果进行整合处理,上传整合后的数据至后台远程终端。本发明用以语音识别技术为主,人脸识别技术和动作识别技术为辅的三重安防监测方式,实现对目标环境的高可靠性安全防控,较之单一安防监测方式大大提高了其检测结果的准确性和可靠性。

    一种用于数据库计算引擎节点执行时动态扩缩的方法

    公开(公告)号:CN120066781A

    公开(公告)日:2025-05-30

    申请号:CN202510135317.4

    申请日:2025-02-07

    Inventor: 吴启文 丁卓

    Abstract: 本发明涉及数据处理技术领域,具体涉及一种用于数据库计算引擎节点执行时动态扩缩的方法,包括如下步骤:提供查询集群扩缩挂起策略的接口;生成并采集计算集群内核心指标,并根据元数据提供的集群当前扩缩挂起策略来判断集群是否需要挂起及扩缩;接收计算集群的扩缩、挂起请求,进行合法性校验;执行挂起、扩缩动作,通过上述方式,实现资源调整的自动化和无缝衔接,减少人工干预,提高数据库系统灵活性和响应速度。

    基于图卷积网络的匿名说话人攻击方法

    公开(公告)号:CN120048241A

    公开(公告)日:2025-05-27

    申请号:CN202510192231.5

    申请日:2025-02-21

    Abstract: 本发明涉及语言转换技术领域,具体涉及一种基于图卷积网络的匿名说话人攻击方法;包括如下步骤:将F0特征与原始F0特征进行拼接融合作为新F0特征;提取音频的特征并进行矢量量化;将处理后的F0特征和特征进行拼接,生成匿名化语音;计算来自试验话语和注册话语的说话者嵌入;输出匿名化试验话语嵌入和匿名化注册话语嵌入的相似性分数,根据分数判断是否属于同一说话人;通过多个试验和注册话语对,计算等错误率作为性能指标,评估攻击者系统对匿名化系统的攻击能力;通过考虑F0特征不同帧之间的时间相关性,利用图卷积网络和F0特征协同匿名说话人身份信息,来提升攻击者系统性能。

    基于改进卷积循环网络的轻量化单通道语音增强方法

    公开(公告)号:CN119993175A

    公开(公告)日:2025-05-13

    申请号:CN202510157170.9

    申请日:2025-02-13

    Abstract: 本发明涉及语音增强技术领域,具体涉及一种基于改进卷积循环网络的轻量化单通道语音增强方法:充分利用改进卷积循环网络在提取特征时的出色能力,使用聚合分组双路径循环网络和卷积混合分组双路径循环网络来提升多通道的深度时频特征以及对各通道之间的特征进行融合,使得深度特征所包含的语音信息更加的丰富,再利用深度特征来训练分离模型,进一步增强语音的性能,并且提出了聚合分组双路径循环网络和卷积混合分组双路径循环网络,改进了分组双路径循环网络架构,不仅使得卷积循环网络的语音增强性能得到了提升,而且保持了模型的轻量化,从而提高了增强模型的有效性,使得增强语音的清晰度和可懂度提高。

    基于生成式大模型的风险资金预测方法及系统

    公开(公告)号:CN119963332A

    公开(公告)日:2025-05-09

    申请号:CN202510052036.2

    申请日:2025-01-14

    Inventor: 段艺博 丁卓

    Abstract: 本发明涉及金融风险管理技术领域,具体涉及一种基于生成式大模型的风险资金预测方法及系统,实时收集金融交易数据;对收集到的数据进行预处理,并采用深度特征聚类技术,将相似的交易行为聚集在一起;采用Qwen‑2模型作为核心,针对交易数据调整生成式大模型参数,实现风险交易大模型的构建、用户交易画像的生成、风险交易预测与预警,以及模型反馈机制;将生成式大模型的输出与实时交易数据结合,快速识别潜在的异常交易,并输出风险评分;结合自然语言处理技术,实现语音生成与用户的智能客服交互,实时反馈风险评估结果并提供相应建议。解决了现有技术在风险资金预测中存在不足的问题。

    互联网项目开发智能项目管理系统及方法

    公开(公告)号:CN119671140A

    公开(公告)日:2025-03-21

    申请号:CN202411730250.0

    申请日:2024-11-29

    Inventor: 董乐 蔡势坤 丁卓

    Abstract: 本发明涉及项目管理技术领域,具体涉及一种互联网项目开发智能项目管理系统及方法:包括项目管理平台、信息更新及任务分配模块、资源配置模块、项目更新模块、风险管控模块和决策支持模块,通过信息更新及任务分配模块、资源配置模块、项目更新模块、风险管控模块和决策支持模块的设置,实现项目管理的全面智能化和自动化,提高项目管理效率,优化资源分配,实现实时监控和全面的风险管理,为项目管理决策提供科学的支持,从而显著提升互联网项目开发的管理水平和成功率。

    一种场景话术分类系统
    50.
    发明公开

    公开(公告)号:CN119106137A

    公开(公告)日:2024-12-10

    申请号:CN202411274850.0

    申请日:2024-09-12

    Inventor: 谢羽凯 丁卓

    Abstract: 本发明涉及电子数字数据处理技术领域,具体涉及一种场景话术分类系统,包括话术样本关键词提取模块、音频处理模块和话术筛选模块;话术样本关键词提取模块、音频处理模块和话术筛选模块依次连接;话术样本关键词提取模块用于提取诈骗样本话术中的关键词,并将关键词分类加入词库中;音频处理模块用于提取音频中的关键词,并将关键词分类加入词库中;话术筛选模块用于根据词库中的关键词评估文本的风险等级;本发明能够满足特殊场景下的业务功能需求,且能在占用极少资源的情况下,同时保证高效、高准确率的场景话术分类。

Patent Agency Ranking