-
公开(公告)号:CN101202041A
公开(公告)日:2008-06-18
申请号:CN200610167040.0
申请日:2006-12-13
Applicant: 富士通株式会社
CPC classification number: G10L13/10
Abstract: 本发明为一种汉语韵律词组词方法及装置,所述方法包括:输入汉语文本;对输入的汉语文本进行分词和词性标注处理,生成一初始的韵律词序列;在初始的韵律词序列中所有的词边界上插入代表韵律词边界的隔栅,生成一隔栅韵律词序列;根据韵律词组词手段标注隔栅韵律词序列中预备删除的隔栅;根据韵律词组词手段判断预备删除的隔栅中实际需要删除的隔栅;删除隔栅韵律词序列中实际需要删除的隔栅,并使剩余隔栅中的每两个隔栅之间的词进行组词,生成韵律词。通过减少韵律词边界插入型错误的数目,尽量避免韵律词组词中插入型错误而导致的语音难以理解或者不自然的缺陷,减少韵律词边界插入类型错误的数目。