基于深度学习的动态知识库客服交互系统

    公开(公告)号:CN118332141A

    公开(公告)日:2024-07-12

    申请号:CN202410759486.0

    申请日:2024-06-13

    Inventor: 赵胜 丁卓 潘焕平

    Abstract: 本发明涉及计算机技术领域,具体涉及一种基于深度学习的动态知识库客服交互系统;包括多模态输入模块、多模态信息处理模块、语音处理模块、更新模块、行为分析与预测模块和服务响应模块,多模态信息处理模块用于处理和分析多模态输入数据,识别用户的需求和情绪;语音处理模块用于语音识别和情感分析;行为分析与预测模块用于分析用户交互行为和反馈,预测用户的需求和偏好;更新模块用于根据接收数据动态更新知识库内容;服务响应模块用于综合各个模块的分析和处理数据,生成用户需求响应,并进行呈现;通过上述方式,能够更准确地理解、响应用户需求,实时学习和进化,以不断提升服务质量和效率。

    多重对抗判别伪造音频检测系统

    公开(公告)号:CN118280389A

    公开(公告)日:2024-07-02

    申请号:CN202410365711.2

    申请日:2024-03-28

    Abstract: 本发明涉及语音识别技术领域,具体涉及一种多重对抗判别伪造音频检测系统;包括数据采集模块、波形检测模型、时域特征建模模块和对抗神经网络分类器;波形检测模型用于提取预处理后的原始音频数据中的频谱,基于频谱的连续性判别原始音频是否为真实音频;时域特征建模模块用于对音频波形与特征进行建模;对抗神经网络分类器用于对特征进行判别,再次判别原始音频是否为真实音频;通过对目标音频进行波形频谱分析,采用深度神经网络对于音频波形与特征进行建模,使用对抗神经网络对特征进行判别,从而判断音频来源是否伪造,获得检测出深度音频的伪造,提高检测的准确性和鲁棒性的效果。

    异构多说话人自适应语音会议记录系统及方法

    公开(公告)号:CN118038886A

    公开(公告)日:2024-05-14

    申请号:CN202410179297.6

    申请日:2024-02-18

    Inventor: 段艺博 丁卓

    Abstract: 本发明涉及会议记录技术领域,具体涉及一种异构多说话人自适应语音会议记录系统及方法;包括多通道语音采集模块、语音分离模块、语音识别模块、会议记录模块、说话人识别模块和说话人标注模块;多通道语音采集模块用于获取不同方位的语音;语音分离模块用于将多个说话人混合的语音信号分离为独立的单说话人语音;语音识别模块用于根据输出语音进行识别并输出;说话人识别模块用于根据输出语音确定说话人;说话人标注模块用于对说话人的身份进行标注;会议记录模块用于记录文本数据及说话人身份的标注数据;通过上述方式,实现了分离语音与对应说话人的匹配,对分离并标注说话人的语音信号进行转录,生成多说话人的会议记录。

    用于电话语音识别的信息处理方法及装置

    公开(公告)号:CN117765951A

    公开(公告)日:2024-03-26

    申请号:CN202311224332.3

    申请日:2023-09-21

    Inventor: 赵胜 丁卓

    Abstract: 本申请公开了一种用于电话语音识别的信息处理方法及装置,其中方法包括获取非电话信道语音数据,并对所述非电话信道语音数据进行随机速度扰动,得到第一语音数据;对所述第一语音数据添加噪声和混响数据,得到第二语音数据;对所述第二语音数据进行音频降采样,并将降采样后的数据进行电话信道传输模拟,得到第三语音数据;基于所述第三语音数据,对预设的声纹识别用模型进行训练,以作为训练样本对所述预设的声纹识别用模型进行训练。通过特定的数据增强方式得到的数据用于声纹识别系统模型训练,实现少数据量情况下的电话信道声纹识别模型的训练,进而克服了在没有真实的电话数据可用的情况下将难以针对电话数据实施模型的训练的问题。

    一种可持续便捷的代码更新监控方法

    公开(公告)号:CN117648234A

    公开(公告)日:2024-03-05

    申请号:CN202311700402.8

    申请日:2023-12-11

    Inventor: 谢羽凯 丁卓

    Abstract: 本发明涉及电子数字数据处理技术领域,具体涉及一种可持续便捷的代码更新监控方法,本发明采用WebSocket技术建立长连接,实现实时接收GitLab代码仓库的事件通知,提高监控的实时性,通过设置Webhook机制和长连接,避免了频繁的轮询和无效请求,减少网络带宽和服务器资源的浪费,提供可定制的通知方式和触发条件,满足不同团队的监控需求,支持钉钉机器人、邮件通知等多种渠道,程序可精准统计团队成员的代码提交情况,包括提交次数、时间等信息,帮助团队管理和项目进展评估,从而解决了现有的代码更新监控方法实用性较低的问题。

    一种基于半监督模型的声音检测方法

    公开(公告)号:CN117558291A

    公开(公告)日:2024-02-13

    申请号:CN202311312313.6

    申请日:2023-10-11

    Abstract: 本发明公开了一种基于半监督模型的声音检测方法,通过针对无标签音频数据的对数梅尔频谱对进行弱增强策略、强增强策略,分别得到弱增强、强增强对数梅尔频谱对。本发明以强标签、弱标签、无标签对数梅尔频谱、弱增强、强增强对数梅尔频谱对为输入、音频数据的类别和时间为输出,构建和训练教师模型和学生模型,并且在训练学生模型过程中,针对弱增强、强增强对数梅尔频谱图的预测值进行相似损失计算,针对强标签、弱标签对数梅尔频谱图的预测值进行分类损失计算;同时计算教师模型和学生模型的一致性损失,最终得到半监督声音检测模型。本发明优化改进了现有的平均教师模型,提出了相似损失的概念;通过充分利用无标签数据提升了检测的准确度。

    一种基于语音外呼的机器人对话智能预警系统

    公开(公告)号:CN117459640A

    公开(公告)日:2024-01-26

    申请号:CN202310686126.8

    申请日:2023-06-09

    Inventor: 周坤坤 丁卓 鲁宁

    Abstract: 本发明提供的一种基于语音外呼的机器人对话智能预警系统,涉及智能预警系统技术领域,包括:数据接入模块、数据融合模块、NLP神经网络构建模块、NLP神经网络分析模块和数据展现模块;数据接入模块,操作于连接多种数据源,接受多种数据源的数据并进行预处理;数据融合模块,操作于对多种数据源数据进行融合处理和质量评估。本发明,能够通过智能外呼系统进行外呼,减轻办事人员工作量,释放人工坐席,处理重要信息,提升工作质效。并将AI技术融于反电诈,及时高效全覆盖的外呼,对市民进行提醒、劝阻、宣传,减少市民损失,提升市民满意度;为易受骗人群提供便捷、自然的语音交互服务,为一线办事人员提供高效的预警劝阻工作辅助。

    一种支持多语种的智能听说训练装置

    公开(公告)号:CN117275456A

    公开(公告)日:2023-12-22

    申请号:CN202311347827.5

    申请日:2023-10-18

    Inventor: 赵胜 丁卓 鲁宁

    Abstract: 本发明涉及语种学习技术领域,具体公开了一种支持多语种的智能听说训练装置,包括主机本体、语音真实度模块、语法语义模块、上下文处理模块、SVC克隆模块和TTS心情模块;本发明提供了录音和回放、发音评估、口语练习材料选择与浏览、实时对话交流的多个功能模块,能够满足用户进行口语训练所需的各个方面的需求,用户可以在一个装置上完成全面的口语训练,无需在不同的平台或设备上切换,能够根据用户的口语练习数据和分析结果,给出个性化的评估和建议,可以根据用户的口语表现,评估发音准确度、流利度、语速的关键指标,给出相对应的评分和建议,帮助用户改进口语的表达能力。

    一种面向实时语音通讯的丢包补偿方法

    公开(公告)号:CN116248229B

    公开(公告)日:2023-12-01

    申请号:CN202211572689.6

    申请日:2022-12-08

    Abstract: 本发明公开一种面向实时语音通讯的丢包补偿方法,包括如下步骤:构建基于对抗神经网络的补偿训练模型,所述补偿训练模型包括补偿系数生成器、谐波组和逼真度判别器;将历史音频输入至所述补偿系数生成器和谐波组中处理,获得初始修补音频;通过所述逼真度判别器计算初始修补音频与所述历史音频所对应的无丢包真实音频之间的相似度;基于相似度,更新补偿训练模型的参数,继续训练,直到模型收敛或达到最大迭代次数,输出当前的补偿系数生成器和谐波组作为训练好的丢包补偿模型。本发明能够更加准确地预测出丢失的音频帧,提高实时语音通讯中的音频质量。

Patent Agency Ranking