-
公开(公告)号:CN103324609A
公开(公告)日:2013-09-25
申请号:CN201210574520.4
申请日:2012-12-26
Applicant: 富士通株式会社
IPC: G06F17/27
CPC classification number: G06F17/28 , G06F17/2223 , G06F17/273
Abstract: 本公开涉及一种文本校对装置以及文本校对方法。根据实施例的一种日文较对装置具有校正历史文集、校对候选者生成单元、校对可用性确定单元和自动校对单元。校正历史文集彼此关联地存储作为校对前文句的反面文句以及作为校对后文句的正例文句。校对候选者生成单元根据校对对象文句的特性,从校正历史文集获取与校对前文句对应的校对后文句。校对可用性确定单元从校对候选者生成单元获取的校对后文句中选择校对对象文句和校对后文句之间的相似度等于或大于预定阈值的校对后文句作为校对候选者。自动校对单元使用校对可用性确定单元选择的校对后文句中的、具有最高相似度的校对后文句来对校对对象文句进行校对。
-
公开(公告)号:CN103324609B
公开(公告)日:2017-05-03
申请号:CN201210574520.4
申请日:2012-12-26
Applicant: 富士通株式会社
IPC: G06F17/27
CPC classification number: G06F17/28 , G06F17/2223 , G06F17/273
Abstract: 本公开涉及一种文本校对装置以及文本校对方法。根据实施例的一种日文较对装置具有校正历史文集、校对候选者生成单元、校对可用性确定单元和自动校对单元。校正历史文集彼此关联地存储作为校对前文句的反面文句以及作为校对后文句的正例文句。校对候选者生成单元根据校对对象文句的特性,从校正历史文集获取与校对前文句对应的校对后文句。校对可用性确定单元从校对候选者生成单元获取的校对后文句中选择校对对象文句和校对后文句之间的相似度等于或大于预定阈值的校对后文句作为校对候选者。自动校对单元使用校对可用性确定单元选择的校对后文句中的、具有最高相似度的校对后文句来对校对对象文句进行校对。
-
公开(公告)号:CN102129422B
公开(公告)日:2015-10-14
申请号:CN201010004202.5
申请日:2010-01-14
Applicant: 富士通株式会社
IPC: G06F17/27
Abstract: 本发明公开了一种模板提取方法和装置。所述模板提取方法包括:对语料进行包括分句和分词在内的预处理;从预处理后的语料中提取出候选模板;以及对提取出的候选模板进行优化。其中,所述优化步骤包括:针对每一个候选模板,计算由该候选模板中的通配符所代表的词或词序列在语料中出现的频率以及该候选模板中由通配符分隔出的词或词序列在语料中出现的频率;以及确定其中通配符所代表的词或词序列在语料中出现的频率以及所述候选模板中由所述通配符分隔出的词或词序列在语料中出现的频率满足预定条件的候选模板为干扰模板,并从所提取出的候选模板中去除所述干扰模板。
-
公开(公告)号:CN102129422A
公开(公告)日:2011-07-20
申请号:CN201010004202.5
申请日:2010-01-14
Applicant: 富士通株式会社
IPC: G06F17/27
Abstract: 本发明公开了一种模板提取方法和装置。所述模板提取方法包括:对语料进行包括分句和分词在内的预处理;从预处理后的语料中提取出候选模板;以及对提取出的候选模板进行优化。其中,所述优化步骤包括:针对每一个候选模板,计算由该候选模板中的通配符所代表的词或词序列在语料中出现的频率以及该候选模板中由通配符分隔出的词或词序列在语料中出现的频率;以及确定其中通配符所代表的词或词序列在语料中出现的频率以及所述候选模板中由所述通配符分隔出的词或词序列在语料中出现的频率满足预定条件的候选模板为干扰模板,并从所提取出的候选模板中去除所述干扰模板。
-
-
-