-
公开(公告)号:CN115862584A
公开(公告)日:2023-03-28
申请号:CN202111124499.3
申请日:2021-09-24
Applicant: 华为云计算技术有限公司
IPC: G10L13/02 , G10L13/10 , G10L15/26 , G06F40/117 , G06F40/284
Abstract: 本申请实施例公开了一种韵律信息标注方法以及相关设备,用于提高标注的效率。本申请实施例方法包括:计算机设备获取音频信息以及第一文本信息。计算机设备标注第一文本信息中的韵律词以及韵律短语,得到第一标注后文本,第一标注后文本中的韵律短语需要基于所述音频信息进行。计算机设备基于第一标注后文本中标注的韵律词、第一标注后文本中标注的韵律短语以及音频信息标注第一标注后文本中的语调短语,得到第二标注后文本。
-
公开(公告)号:CN115700584A
公开(公告)日:2023-02-07
申请号:CN202110838414.1
申请日:2021-07-23
Applicant: 华为云计算技术有限公司
IPC: G06F40/289 , G06F16/33 , G06F18/214 , G06N3/02
Abstract: 本申请实施例公开了一种分词方法及其相关设备,涉及自然语言处理领域。该方法包括获取分词策略,分词策略包括构词方式信息。根据构词方式信息,对已标注语料进行筛选,获得目标已标注语料。其中,每个目标已标注语料均携带有对应的标注信息。根据目标已标注语料对目标分词模型进行训练。利用训练后的目标分词模型对语言文本数据进行分词处理。利用上述方法,可以根据用户偏好的分词策略来获取目标分词模型,一方面可以减少标注语料资源的浪费,另一方面可以获得满足用户个性化需求的自定义分词模型,提高了分词效率。
-