一种基于声纹比对和生成对抗网络的语音增强方法

    公开(公告)号:CN109326302B

    公开(公告)日:2022-11-08

    申请号:CN201811353760.5

    申请日:2018-11-14

    Abstract: 本发明公开一种基于声纹比对和生成对抗网络的语音增强方法,1)建立三个语音数据库,分别对应声纹识别编码器、噪声分离系统和语音分离系统;2)训练声纹识别编码器提取目标说话者的声纹特征,得目标声纹特征;3)将带噪音频转化成语谱图送入噪声分离系统中的生成器中,得预测干净音频;4)将预测干净音频和真实干净音频送入噪声分离系统中的鉴别器训练;5)调整鉴别器权重参数,使鉴别器更好地分辨出真实干净音频和预测干净音频的区别,得到产生近乎真实的干净音频的生成器;6)将说话者的声音送入已经训练好的生成器中,生成预测干净语谱图,得到增强的语音信号。该方法规模小、计算低、易于移植、保持一定的空间不变性且去噪效果好。

    一种基于多源数据的公交车辆风险评价系统与方法

    公开(公告)号:CN111210163A

    公开(公告)日:2020-05-29

    申请号:CN202010039318.6

    申请日:2020-01-15

    Abstract: 本发明公开了一种基于多源数据的公交车辆风险评价系统与方法,该系统包括前端数据采集模块、单点公交时空风险评价模块、全网公交运行风险评价模块、数据处理与参数自学习模块;前端数据采集模块实时将多源数据发送至数据处理与参数自学习模块,当数据达到一定量时,数据处理与参数自学习模块对所累计的历史多源数据进行处理和参数与权重自学习,数据处理与参数自学习模块将学习好的参数及相关指标权重传输至单点公交时空风险评价模块、全网公交运行风险评价模块完成算法自我构建;同时前端数据采集模块实时采集时间、经纬度、天气信息数据,实时发送给单点公交时空风险评价模块、全网公交运行风险评价模块,实现对公交车辆运行风险动态评价。

    一种基于电动自行车风险驾驶行为量表的分析系统

    公开(公告)号:CN111507617A

    公开(公告)日:2020-08-07

    申请号:CN202010296386.0

    申请日:2020-04-15

    Abstract: 本发明公开了一种基于电动自行车风险驾驶行为量表的分析系统,该分析系统基于电动自行车风险驾驶行为量表(ERBQ),设计一种适用于该量表的数据分析系统,以提高量表数据调查分析的效率且确保调查结果的真实性,从而分析影响电动自行车风险驾驶行为的指标因素以深入探究电动自行车风险驾驶行为的内在行为机理,为进一步进行电动自行车事故分析提供理论基础;可实现快速、大规模的对被试者风险驾驶行为进行分析评估,随着数据的实时更新,不断扩大的样本量会使数据分析结果更准确;系统针对性强,可得到专门针对风险行为的评估结果,为制定电动自行车安全管理策略,改善电动自行车交通秩序,降低事故率提供依据。

    一种基于多源数据的公交车辆风险评价系统与方法

    公开(公告)号:CN111210163B

    公开(公告)日:2023-04-07

    申请号:CN202010039318.6

    申请日:2020-01-15

    Abstract: 本发明公开了一种基于多源数据的公交车辆风险评价系统与方法,该系统包括前端数据采集模块、单点公交时空风险评价模块、全网公交运行风险评价模块、数据处理与参数自学习模块;前端数据采集模块实时将多源数据发送至数据处理与参数自学习模块,当数据达到一定量时,数据处理与参数自学习模块对所累计的历史多源数据进行处理和参数与权重自学习,数据处理与参数自学习模块将学习好的参数及相关指标权重传输至单点公交时空风险评价模块、全网公交运行风险评价模块完成算法自我构建;同时前端数据采集模块实时采集时间、经纬度、天气信息数据,实时发送给单点公交时空风险评价模块、全网公交运行风险评价模块,实现对公交车辆运行风险动态评价。

    一种基于声纹比对和生成对抗网络的语音增强方法

    公开(公告)号:CN109326302A

    公开(公告)日:2019-02-12

    申请号:CN201811353760.5

    申请日:2018-11-14

    Abstract: 本发明公开一种基于声纹比对和生成对抗网络的语音增强方法,1)建立三个语音数据库,分别对应声纹识别编码器、噪声分离系统和语音分离系统;2)训练声纹识别编码器提取目标说话者的声纹特征,得目标声纹特征;3)将带噪音频转化成语谱图送入噪声分离系统中的生成器中,得预测干净音频;4)将预测干净音频和真实干净音频送入噪声分离系统中的鉴别器训练;5)调整鉴定器权重参数,使鉴定器更好地分辨出真实干净音频和预测干净音频的区别,得到产生近乎真实的干净音频的生成器;6)将说话者的声音送入已经训练好的生成器中,生成预测干净语谱图,得到增强的语音信号。该方法规模小、计算低、易于移植、保持一定的空间不变性且去噪效果好。

    一种基于专家先验知识和LTP复杂光照下的人脸识别方法

    公开(公告)号:CN112800914A

    公开(公告)日:2021-05-14

    申请号:CN202110075564.1

    申请日:2021-01-20

    Abstract: 本发明公开一种基于专家先验知识和LTP复杂光照下的人脸识别方法,1)定位面部地标点并裁剪;2)根据专家先验知识,对面部图像关键区域进行划分,生成面部掩码;3)使用自适应阈值的局部三值模式算法(LTP)针对不同的关键区域,分别计算其区域像素离散度σ作为阈值t,并提取其光照不变纹理特征;4)将面部图像送入一个卷积层,得到面部图像的全局特征;5)面部全局特征与面部光照不变纹理特征相结合,并送入ResNet101网络模型,通过分类层分别得出与数据库中N个对象的相似度得分,返回相似度得分最高的值所对应的对象身份,作为人脸识别的结果。该方法是一种端对端的模型,无需预训练,对复杂的光照环境有较强的鲁棒性,且有很好的扩展性。

Patent Agency Ranking