-
公开(公告)号:CN1503193A
公开(公告)日:2004-06-09
申请号:CN03104955.9
申请日:2003-02-28
Applicant: 株式会社日立制作所
Abstract: 本发明提供一种作为对纸文件及文件图像进行文件检索的OCR装置、文件检索系统及文件检索手段,该手段是应用文字识别技术,检索含有给定关键词的文件群的方法。本发明的发明目的是通过提供一种系统,该系统将OCR装置和检索装置分离,采用永久性保持文字行提取、文字切出以及文字识别多重假说的文件(OCR读取假说文件)作为OCR的输出形式,构成以该OCR读取假说文件为基础进行关键词检索的机能,实现必要的文件检索和文件分类。
-
公开(公告)号:CN100351847C
公开(公告)日:2007-11-28
申请号:CN03104955.9
申请日:2003-02-28
Applicant: 株式会社日立制作所
Abstract: 本发明提供一种作为对纸文件及文件图像进行文件检索的OCR装置、文件检索系统及文件检索手段,该手段是应用文字识别技术,检索含有给定关键词的文件群的方法。本发明的发明目的是通过提供一种系统,该系统将OCR装置和检索装置分离,采用永久性保持文字行提取、文字切出以及文字识别多重假说的文件(OCR读取假说文件)作为OCR的输出形式,构成以该OCR读取假说文件为基础进行关键词检索的机能,实现必要的文件检索和文件分类。
-