基于VAWGAN-AC的多对多语音转换方法

    公开(公告)号:CN110060701A

    公开(公告)日:2019-07-26

    申请号:CN201910268596.6

    申请日:2019-04-04

    Abstract: 本发明公开了一种基于VAWGAN-AC的多对多语音转换方法,包括了训练部分和转换部分,使用了条件变分自编码器和生成对抗网络(VAWGAN)与辅助分类生成对抗网络(ACGAN)相结合的方式来实现语音转换系统,通过在VAWGAN的鉴别器中添加辅助分类信息来增加输出分类与真实分类的损失计算,使生成的频谱与其所属的类别一一对应,得到分类损失并添加到生成器与鉴别器的损失函数中,从而对生成器添加类别约束,进一步提升生成器生成频谱的质量,减少转换过程中带来的噪声,能够较好地提升语音转换后的质量和个性相似度,实现高质量的语音转换。

    基于SN的多对多说话人转换方法

    公开(公告)号:CN110060657A

    公开(公告)日:2019-07-26

    申请号:CN201910268565.0

    申请日:2019-04-04

    Abstract: 本发明公开了一种基于SN的多对多说话人转换方法,包括训练阶段和转换阶段,使用了STARGAN-ResNet与SN相结合来实现语音转换系统,利用SN(Switchable norm)解决STARGAN-ResNet中数据标准化过程中的噪声问题,通过为深度网络中的每一个标准化层确定合适的标准化操作来改善STARGAN-ResNet的数据标准化过程中产生的噪声问题,能够较好地提升模型对于语义的学习能力以及语音频谱的合成能力,从而较好地提升转换后语音的个性相似度和语音质量,克服转换后语音相似度与自然度较差的问题,实现了一种高质量的语音转换方法。

    一种窄带隙共轭分子及其制备方法与应用

    公开(公告)号:CN103880849A

    公开(公告)日:2014-06-25

    申请号:CN201410079507.0

    申请日:2014-03-05

    Abstract: 本发明涉及一类基于三并咔唑为给体(D)、苯噻唑或噻吩并噻唑为受体(A)的D-A-D(Donor-Accepter-Donor)窄带隙共轭分子及其制备方法;该类材料可适用于溶液法加工制膜,作为活性层材料应用于有机太阳能电池。其具有如式I的结构:其中,A为式II中的苯并噻唑(A1)或噻吩联苯并噻唑(A2、A3):R为C1-C20的烷基或烷氧基;*为连接位置;N是氮原子;S是硫原子;本发明材料表现出良好的热稳定性能、成膜稳定性和较高的载流子迁移率,和窄的光学能隙,可吸收更宽波谱范围内的太阳光,可作为活性材料广泛应用于有机太阳能电池器件。

    基于i向量和VARSGAN的多对多语音转换方法

    公开(公告)号:CN110060691B

    公开(公告)日:2023-02-28

    申请号:CN201910304431.X

    申请日:2019-04-16

    Abstract: 本发明公开了一种基于i向量和VARSGAN的多对多语音转换方法,包括训练阶段和转换阶段,使用了VARSGAN(变分自编码器相对生成对抗网络)与i向量相结合的方式实现语音转换。通过构造相对判别器的方式,使得判别器的输出依赖于真实样本和生成样本间的相对值,在训练生成器时真实样本也能参与训练,从而改善了判别器中可能存在的偏置情况,使得梯度更加稳定,训练更加容易,并且把真实样本引入到生成器的训练中,从而加快了GAN的收敛速度,另外加入了能够充分表征说话人的个性特征的i向量,充分学习语义特征和说话人的个性化特征,从而更好地提升转换后语音的个性相似度和语音质量。

    基于VAWGAN-AC的多对多语音转换方法

    公开(公告)号:CN110060701B

    公开(公告)日:2023-01-31

    申请号:CN201910268596.6

    申请日:2019-04-04

    Abstract: 本发明公开了一种基于VAWGAN‑AC的多对多语音转换方法,包括了训练部分和转换部分,使用了条件变分自编码器和生成对抗网络(VAWGAN)与辅助分类生成对抗网络(ACGAN)相结合的方式来实现语音转换系统,通过在VAWGAN的鉴别器中添加辅助分类信息来增加输出分类与真实分类的损失计算,使生成的频谱与其所属的类别一一对应,得到分类损失并添加到生成器与鉴别器的损失函数中,从而对生成器添加类别约束,进一步提升生成器生成频谱的质量,减少转换过程中带来的噪声,能够较好地提升语音转换后的质量和个性相似度,实现高质量的语音转换。

    基于STARGAN和ResNet的多对多说话人转换方法

    公开(公告)号:CN110060690A

    公开(公告)日:2019-07-26

    申请号:CN201910268602.8

    申请日:2019-04-04

    Abstract: 本发明公开了一种基于STARGAN与ResNet的多对多说话人转换方法,包括训练阶段和转换阶段,使用了STARGAN与ResNet相结合来实现语音转换系统,利用ResNet网络解决STARGAN中存在的网络退化问题,能够较好地提升模型对于语义的学习能力以及语音频谱的合成能力,从而较好地提升转换后语音的个性相似度和语音质量,同时使用Instance norm对数据进行标准化,对于转换过程中所产生的噪声能够实现很好的滤除效果,从而克服STARGAN中转换后语音相似度与自然度较差的问题,实现了一种高质量的语音转换方法。本方法能够实现非平行文本条件下的语音转换,训练过程不需要任何对齐过程,还可以将多个源-目标说话人对的转换系统整合在一个转换模型中,即实现多说话人对多说话人转换。

    基于STARGAN与x向量的多对多说话人转换方法

    公开(公告)号:CN109671442A

    公开(公告)日:2019-04-23

    申请号:CN201910030578.4

    申请日:2019-01-14

    Abstract: 本发明公开了一种基于STARGAN与x向量的多对多说话人转换方法,包括训练阶段和转换阶段,使用了STARGAN与x向量相结合来实现语音转换系统,能够较好地提升转换后语音的个性相似度和语音质量,特别是对于短时话语x向量具有更好的表征性能,语音转换质量更好,同时可以克服C-VAE中过平滑的问题,实现了一种高质量的语音转换方法。此外,本方法能够实现非平行文本条件下的语音转换,而且训练过程不需要任何对齐过程,提高了语音转换系统的通用性和实用性,本方法还可以将多个源-目标说话人对的转换系统整合在一个转换模型中,即实现多说话人对多说话人转换,在跨语种语音转换、电影配音、语音翻译等领域有较好的应用前景。

    一种三并茚-芘衍生物蓝光材料及其制备方法与应用

    公开(公告)号:CN103242129A

    公开(公告)日:2013-08-14

    申请号:CN201310138709.3

    申请日:2013-04-19

    Abstract: 本发明涉及一种三并茚-芘衍生物蓝光材料及其制备方法与应用,该材料以三并茚为核、以芘封端的多取代化合物,其通式结构如下式I所示: -----I) 其中,R为C1-C12的烷基;该材料具有合成工艺简单,易于量产,易于纯化,可通过简易的柱层析方法得到高的化学纯度等特点;作为发光薄膜材料的应用表现出优异的发光性能、热稳定性能、无定形性能以及光谱热稳定性能,在有机电致发光、有机激光等领域有重要的应用潜力。特别地,使用该材料作为发光层的有机电致发光器件得到了高效的电致蓝光发射、改善的色纯度和优异的光谱及器件稳定性能,是一种有实用前景的蓝色有机电致发光材料。

    非平行文本条件下基于VAE与i-vector的多对多语音转换系统

    公开(公告)号:CN109584893B

    公开(公告)日:2021-09-14

    申请号:CN201811597896.0

    申请日:2018-12-26

    Abstract: 本发明提供一种非平行文本条件下基于VAE与身份特征向量(i‑vector)的多对多语音转换系统,在非平行语料条件下,基于变分自编码模型(Variational Autoencoding,VAE)实现语音转换,其中说话人的表征加入了说话人身份特征i‑vector,能够有效地提升转换后语音的个性相似度。本发明的优点包括三个方面:1)解除对平行文本的依赖,并且训练过程不需要任何对齐操作;2)可以将多个源‑目标说话人对的转换系统整合在一个转换模型中,即实现多对多转换;3)i‑vector特征的引入能够丰富说话人身份信息,从而有效提高转换语音的个性相似度,改善转换性能。

    基于STARWGAN-GP和x向量的多对多说话人转换方法

    公开(公告)号:CN109599091B

    公开(公告)日:2021-01-26

    申请号:CN201910030577.X

    申请日:2019-01-14

    Inventor: 李燕萍 曹盼 张燕

    Abstract: 本发明公开了一种基于STARWGAN‑GP和x向量的多对多说话人转换方法,包括训练阶段和转换阶段,使用了STARWGAN‑GP与x向量相结合来实现语音转换系统。本方法加入了表征性能和实用性能更好的X‑vector向量来表征说话人的个性化特征,并且使用WGAN‑GP来替换GAN,从而解决GAN训练不稳定、梯度消失等问题,构建训练更加稳定、收敛速度更快的网络,进一步提升转换后语音的个性相似度和语音质量,实现了一种高质量的语音转换方法。本方法不仅能够解除对平行文本的依赖,实现非平行文本条件下的语音转换,还可以进一步将多个源‑目标说话人对的转换系统整合在一个转换模型中,即实现多说话人对多说话人转换。

Patent Agency Ranking