基于文本的语音生成
    2.
    发明公开

    公开(公告)号:CN115602145A

    公开(公告)日:2023-01-13

    申请号:CN202110721773.9

    申请日:2021-06-28

    Abstract: 根据本公开的实现,提出了一种基于文本生成语音的方案。在该方案中,生成与文本对应的初始音素序列,初始音素序列包括多个音素的特征表示。通过在初始音素序列中插入附加音素的特征表示来生成第一音素序列,附加音素与自然口语的特性有关。通过利用与多个音素和附加音素中的音素对应的专家模型来确定音素的持续时间,基于第一音素序列来生成第二音素序列。基于第二音素序列,确定与文本对应的自然口语类型的语音。以此方式,该方案能够基于自然口语类型的附加音素和多个专家模型来生成具有多变韵律的更真实的自然口语类型的语音。

    说唱生成
    3.
    发明公开
    说唱生成 审中-实审

    公开(公告)号:CN115547278A

    公开(公告)日:2022-12-30

    申请号:CN202110732470.7

    申请日:2021-06-30

    Inventor: 谭旭 秦涛 刘铁岩

    Abstract: 根据本公开的实现,提出了一种用于说唱生成的方案。在该方案中,获取与说唱的第一部分相对应的输入序列。在输入序列中,第一部分的同一语句中的各个词按逆序排列,并且第一部分的节拍的节拍标识与对应于节拍的词相邻。确定分别与输入序列相对应的文本表示序列和押韵表示序列。基于文本表示序列和押韵表示序列,根据说唱生成模型,生成说唱的第二部分。以此方式,可以生成既押韵又具有节奏的说唱。

    基于未标注数据的多过程协同训练

    公开(公告)号:CN107798386A

    公开(公告)日:2018-03-13

    申请号:CN201610837511.8

    申请日:2016-09-01

    Inventor: 贺笛 刘铁岩 秦涛

    CPC classification number: G06N5/022 G06F17/289

    Abstract: 本公开的实施例涉及基于未标注数据的多过程协同训练。在利用一个转换过程将一种类型的信息转换为另一种不同类型的信息之后,确定利用逆向的转换过程将该信息转换回原始信息的可能性,继而至少部分地基于该可能性来更新互逆的转换过程中的至少一个。此种方式仅使用两种类型信息的未标注数据来训练,而无需两种类型信息的对齐的平行数据,从而既提高了训练效率,又显著降低了学习成本。

    针对自然语言的语义处理

    公开(公告)号:CN107818076B

    公开(公告)日:2021-11-12

    申请号:CN201610818984.3

    申请日:2016-09-12

    Inventor: 秦涛 刘铁岩

    Abstract: 在本公开的实施例中,提出了一种针对自然语言的语义处理的方法和设备。在获得包括多个项目的项目集之后,确定每个项目在一组语义维度上的一个量化表示和在另一组维度上的另一量化表示,然后使用这两组维度上的量化表示来生成每个项目的语义值。根据本公开的实施例,语义值能够用于确定项目集中的不同项目之间的语义相关性,并且每个量化表示可以由项目集中的多个项目共享。因此,通过使得多个项目共享同一量化表示,本公开在针对自然语言的语义处理过程中,不仅能够有效减小语义模型的大小,而且能够显著提高语义处理的速度。

    针对自然语言的语义处理

    公开(公告)号:CN107818076A

    公开(公告)日:2018-03-20

    申请号:CN201610818984.3

    申请日:2016-09-12

    Inventor: 秦涛 刘铁岩

    CPC classification number: G06F17/2785 G06N3/0445 G06N3/08

    Abstract: 在本公开的实施例中,提出了一种针对自然语言的语义处理的方法和设备。在获得包括多个项目的项目集之后,确定每个项目在一组语义维度上的一个量化表示和在另一组维度上的另一量化表示,然后使用这两组维度上的量化表示来生成每个项目的语义值。根据本公开的实施例,语义值能够用于确定项目集中的不同项目之间的语义相关性,并且每个量化表示可以由项目集中的多个项目共享。因此,通过使得多个项目共享同一量化表示,本公开在针对自然语言的语义处理过程中,不仅能够有效减小语义模型的大小,而且能够显著提高语义处理的速度。

    基于个别网站的历史查询对新的查询进行转换的方法

    公开(公告)号:CN103136310B

    公开(公告)日:2017-11-28

    申请号:CN201110413826.7

    申请日:2011-12-02

    Abstract: 本发明揭示了一种基于个别网站的历史查询对新的查询进行转换的方法。每个特定网站有自己的内容偏好和自己的用户群。当用户在某个网站进行查询,该查询与多数情况与该网站内容相关。本发明利用在该网站的历史搜索信息对可能有歧义的原始查询进行转换。之后基于该替代查询在广告引擎中进行搜索,再将搜索到的广告返回给用户,从而使得真正用于广告搜索的查询项与该网站的目标业务更加匹配,同时使得广告结果与用户的搜索意图更匹配。

    基于未标注数据的多过程协同训练

    公开(公告)号:CN107798386B

    公开(公告)日:2022-02-15

    申请号:CN201610837511.8

    申请日:2016-09-01

    Inventor: 贺笛 刘铁岩 秦涛

    Abstract: 本公开的实施例涉及基于未标注数据的多过程协同训练。在利用一个转换过程将一种类型的信息转换为另一种不同类型的信息之后,确定利用逆向的转换过程将该信息转换回原始信息的可能性,继而至少部分地基于该可能性来更新互逆的转换过程中的至少一个。此种方式仅使用两种类型信息的未标注数据来训练,而无需两种类型信息的对齐的平行数据,从而既提高了训练效率,又显著降低了学习成本。

    语音合成和语音识别
    9.
    发明公开

    公开(公告)号:CN113948064A

    公开(公告)日:2022-01-18

    申请号:CN202010620533.5

    申请日:2020-06-30

    Abstract: 根据本公开的实现,提出了用于语音合成和语音识别的方案。根据该方案,支持至少一种语言的语音合成(TTS)模型和自动语音识别(ASR)模型被获取。基于目标语言的第一组配对数据来调整该TTS模型和ASR模型,以支持目标语言。然后,基于第一组配对数据和由ASR模型生成的该目标语言的第一组合成配对数据来优化该TTS模型,同时基于第一组配对数据和由TTS模型生成的该目标语言的第二组合成配对数据来优化该ASR模型。以此方式,该方案能够利用较少的训练数据为缺乏训练数据的语言提供具有较高准确性的TTS模型和ASR模型。

Patent Agency Ranking