-
公开(公告)号:CN114186545B
公开(公告)日:2025-02-25
申请号:CN202111328718.X
申请日:2021-11-10
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F40/186 , G06F40/12
Abstract: 本公开关于一种歌词生成方法、装置、电子设备及存储介质,该方法包括:获取待生成歌词对应的主题词和歌词格式属性信息;根据所述主题词和歌词格式属性信息,确定输入序列,并将所述输入序列输入语言模型;获取所述语言模型的输出序列;根据所述输出序列,确定与所述主题词和歌词格式属性信息对应的歌词内容。本公开由于基于主题词和歌词格式属性信息等多个控制属性联合来控制生成的歌词内容,相比于单一属性的控制可以提高生成的歌词质量,而且相比于多阶段级联的方式可以提高生成的歌词内容与多个控制属性的匹配性,提高歌词内容的准确性。
-
公开(公告)号:CN111080752B
公开(公告)日:2023-08-22
申请号:CN201911286226.1
申请日:2019-12-13
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开公开一种基于音频的动作序列生成方法、装置以及电子设备,涉及数据处理技术领域,包括:提取音频帧序列中各音频帧的特征分量,并确定音频帧序列中各音频帧的位置编码;将音频帧序列中各音频的特征分量以及位置编码依序输入给已训练的基于自注意力机制的模型进行处理,得到音频帧序列对应的动作序列。通过该方式可以获取与音频数据对应的动作序列,增加了音频数据对应动作序列的多样性。
-
公开(公告)号:CN109599128A
公开(公告)日:2019-04-09
申请号:CN201811583191.3
申请日:2018-12-24
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本申请是关于一种语音情感识别方法、语音识别装置、电子设备和可读介质。该语音情感识别方法将待检测语音段输入到语音情感识别模型中,得到情感标签序列,将情感标签序列包含的情感标签按照出现次数进行排序;并采用出现次数大于预设值的情感标签作为待检测语音段的情感标签。该实施例能够输出细粒度的情感标签序列,从而能够细粒度地刻画情感信息的时序性,并提高语音情感识别模型的精度。
-
公开(公告)号:CN115114474A
公开(公告)日:2022-09-27
申请号:CN202110286728.5
申请日:2021-03-17
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/683 , G06F40/211
Abstract: 本公开提供一种关于一种歌词生成模型训练方法、歌词生成方法、装置及存储介质,涉及人工智能领域。包括:获取第一歌词文本,第一歌词文本至少包括一首或多首歌曲的歌词、歌曲中每一句歌词的字数信息;将第一歌词文本转换为训练字符;根据训练字符,对预设网络模型进行训练,得到歌词生成模型;歌词生成模型用于根据输入的待生成歌词的约束条件,生成与约束条件对应的待生成歌词,约束条件至少包括:输入文本以及待生成歌词中每句歌词的字数,待生成歌词包括输入文本,歌词生成模型具备识别训练字符的能力。基于此,歌词生成模型训练装置可以通过在训练歌词文本中增加字数信息,提高歌词生成模型生成符合字数要求的歌词的能力。
-
公开(公告)号:CN111210844A
公开(公告)日:2020-05-29
申请号:CN202010079139.5
申请日:2020-02-03
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开的实施例所得到的语音情感识别模型的确定方法、装置、设备及存储介质,可以通过获取语音样本;将语音样本输入待训练的语音情感识别模型,通过待训练的语音情感识别模型的输出层中预设的K-1个输出节点对语音样本进行分类,得到输出结果,其中,输出层中预设的K-1个输出节点为按照指定顺序排列的输出节点;基于预设损失函数根据输出结果,通过确定待训练的语音情感识别模型的损失;当待训练的语音情感识别模型的损失不满足预设条件时,根据损失对待训练的语音情感识别模型的参数进行调整,直至得到训练好的语音情感识别模型,从而可以是的所获得的语音情感识别模型兼顾情感数值的大小和相对顺序,增加情感分类的准确性。
-
公开(公告)号:CN115114474B
公开(公告)日:2024-10-25
申请号:CN202110286728.5
申请日:2021-03-17
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/683 , G06F40/211
Abstract: 本公开提供一种关于一种歌词生成模型训练方法、歌词生成方法、装置及存储介质,涉及人工智能领域。包括:获取第一歌词文本,第一歌词文本至少包括一首或多首歌曲的歌词、歌曲中每一句歌词的字数信息;将第一歌词文本转换为训练字符;根据训练字符,对预设网络模型进行训练,得到歌词生成模型;歌词生成模型用于根据输入的待生成歌词的约束条件,生成与约束条件对应的待生成歌词,约束条件至少包括:输入文本以及待生成歌词中每句歌词的字数,待生成歌词包括输入文本,歌词生成模型具备识别训练字符的能力。基于此,歌词生成模型训练装置可以通过在训练歌词文本中增加字数信息,提高歌词生成模型生成符合字数要求的歌词的能力。
-
公开(公告)号:CN109599128B
公开(公告)日:2022-03-01
申请号:CN201811583191.3
申请日:2018-12-24
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本申请是关于一种语音情感识别方法、语音识别装置、电子设备和可读介质。该语音情感识别方法将待检测语音段输入到语音情感识别模型中,得到情感标签序列,将情感标签序列包含的情感标签按照出现次数进行排序;并采用出现次数大于预设值的情感标签作为待检测语音段的情感标签。该实施例能够输出细粒度的情感标签序列,从而能够细粒度地刻画情感信息的时序性,并提高语音情感识别模型的精度。
-
公开(公告)号:CN111080752A
公开(公告)日:2020-04-28
申请号:CN201911286226.1
申请日:2019-12-13
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开公开一种基于音频的动作序列生成方法、装置以及电子设备,涉及数据处理技术领域,包括:提取音频帧序列中各音频帧的特征分量,并确定音频帧序列中各音频帧的位置编码;将音频帧序列中各音频的特征分量以及位置编码依序输入给已训练的基于自注意力机制的模型进行处理,得到音频帧序列对应的动作序列。通过该方式可以获取与音频数据对应的动作序列,增加了音频数据对应动作序列的多样性。
-
公开(公告)号:CN111210844B
公开(公告)日:2023-03-24
申请号:CN202010079139.5
申请日:2020-02-03
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开的实施例所得到的语音情感识别模型的确定方法、装置、设备及存储介质,可以通过获取语音样本;将语音样本输入待训练的语音情感识别模型,通过待训练的语音情感识别模型的输出层中预设的K‑1个输出节点对语音样本进行分类,得到输出结果,其中,输出层中预设的K‑1个输出节点为按照指定顺序排列的输出节点;基于预设损失函数根据输出结果,通过确定待训练的语音情感识别模型的损失;当待训练的语音情感识别模型的损失不满足预设条件时,根据损失对待训练的语音情感识别模型的参数进行调整,直至得到训练好的语音情感识别模型,从而可以是的所获得的语音情感识别模型兼顾情感数值的大小和相对顺序,增加情感分类的准确性。
-
公开(公告)号:CN114186545A
公开(公告)日:2022-03-15
申请号:CN202111328718.X
申请日:2021-11-10
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F40/186 , G06F40/12
Abstract: 本公开关于一种歌词生成方法、装置、电子设备及存储介质,该方法包括:获取待生成歌词对应的主题词和歌词格式属性信息;根据所述主题词和歌词格式属性信息,确定输入序列,并将所述输入序列输入语言模型;获取所述语言模型的输出序列;根据所述输出序列,确定与所述主题词和歌词格式属性信息对应的歌词内容。本公开由于基于主题词和歌词格式属性信息等多个控制属性联合来控制生成的歌词内容,相比于单一属性的控制可以提高生成的歌词质量,而且相比于多阶段级联的方式可以提高生成的歌词内容与多个控制属性的匹配性,提高歌词内容的准确性。
-
-
-
-
-
-
-
-
-