-
公开(公告)号:CN104239289B
公开(公告)日:2017-08-29
申请号:CN201310252998.X
申请日:2013-06-24
Applicant: 富士通株式会社
IPC: G06F17/28
Abstract: 本发明公开了音节划分方法和音节划分设备。根据本发明的音节划分方法包括:对于给定的多音节语言单词,根据多音节语言的已知音节表,枚举所有可能的音节划分方式,所述已知音节表中记录有已知音节及其特征概率;根据所述已知音节的特征概率和与所述多音节语言单词对应的单音节语言单词的读音形式,计算每种音节划分方式的总得分;以及选择总得分最高的音节划分方式,作为所述多音节语言单词的音节划分结果。
-
公开(公告)号:CN105335378A
公开(公告)日:2016-02-17
申请号:CN201410291263.2
申请日:2014-06-25
Applicant: 富士通株式会社
Abstract: 本发明实施例提供一种多数据源的信息处理装置、服务器及方法,该装置包括:第一判定单元,用于对至少两个数据源中的信息进行同一实体的判定;链接单元,用于将至少两个数据源中的实体链接到预先设定的外部资源中;第一扩展单元,用于根据外部资源中的信息对实体的属性进行扩展;第二判定单元,用于判断属性扩展后的信息是否满足预先设定的条件,当不满足预先设定的条件时,将属性扩展后的信息用于进行所述同一实体的判定,当满足预先设定的条件时,将属性扩展后的信息输出。通过对同一实体进行判定以及链接外部资源进行扩展属性,并且以迭代的方式进行上述判定和链接,能够有效的进行多数据源的信息整合,提高信息的准确性和全面性。
-
公开(公告)号:CN105095194A
公开(公告)日:2015-11-25
申请号:CN201410222052.3
申请日:2014-05-23
Applicant: 富士通株式会社
IPC: G06F17/28
Abstract: 本发明公开了抽取姓名词典和翻译规则表的方法和设备。根据本发明的抽取用于在日文姓名与英文姓名之间进行翻译的姓名词典和翻译规则表的方法包括:收集英日姓名语料库,其包括日文姓名及对应的英文姓名;针对所收集的日文姓名和英文姓名,划分日文姓名和英文姓名;利用日文汉字发音表,将日文姓名中的日文汉字与英文姓名中的英文音节对齐,该对齐结果作为切分结果,所述日文汉字发音表中记载了日文汉字及其对应的一种或多种英文字符串,所述英文字符串包括一个或多个英文音节;根据上述对齐结果,抽取所述姓名词典和翻译规则表。
-
公开(公告)号:CN104239289A
公开(公告)日:2014-12-24
申请号:CN201310252998.X
申请日:2013-06-24
Applicant: 富士通株式会社
IPC: G06F17/28
Abstract: 本发明公开了音节划分方法和音节划分设备。根据本发明的音节划分方法包括:对于给定的多音节语言单词,根据多音节语言的已知音节表,枚举所有可能的音节划分方式,所述已知音节表中记录有已知音节及其特征概率;根据所述已知音节的特征概率和与所述多音节语言单词对应的单音节语言单词的读音形式,计算每种音节划分方式的总得分;以及选择总得分最高的音节划分方式,作为所述多音节语言单词的音节划分结果。
-
公开(公告)号:CN103678285A
公开(公告)日:2014-03-26
申请号:CN201210320544.7
申请日:2012-08-31
Applicant: 富士通株式会社
IPC: G06F17/28
Abstract: 本发明公开了一种机器翻译方法和机器翻译系统。所述机器翻译方法包括:利用多个机器翻译设备,分别将源语言的原文翻译为目标语言,以得到多个候选译文;利用语言模型,针对多个候选译文分别计算语言模型得分;分别获得多个机器翻译设备给出的关于多个候选译文的设备得分;基于原文的长度和候选译文的长度,针对多个候选译文分别计算长度得分;基于语言模型得分、设备得分、长度得分的至少一个,分别计算多个候选译文的总得分;以及选择总得分最高的候选译文作为机器翻译的结果。
-
-
-
-