-
公开(公告)号:CN102346558A
公开(公告)日:2012-02-08
申请号:CN201010240335.2
申请日:2010-07-26
Applicant: 夏普株式会社
IPC: G06F3/023
CPC classification number: G06F17/242 , G06F3/018
Abstract: 本发明提出了一种笔画结构输入系统和笔画结构输入方法,用于输入中文、日文、韩文等具有笔画和结构的文字。根据本发明的笔画结构输入系统包括:文字笔画结构字典、词组笔画结构字典、输入收集单元、笔画结构到文字转换单元、笔画结构到词组转换单元、候选选择单元,其中将结构信息用作多个文字间的分隔符,提高了输入的效率。此外,本发明的笔画结构输入系统还可以包括预测字典和预测单元,能够提供预测功能。此外,本发明的笔画结构输入系统还可以包括笔顺无关单元,即使用户输入错误的笔画顺序,也能够找到所需的文字。
-
公开(公告)号:CN101551859B
公开(公告)日:2012-01-04
申请号:CN200810090406.8
申请日:2008-03-31
Applicant: 夏普株式会社
CPC classification number: G06K9/00463 , G06K9/00456 , G06K9/38 , G06K9/4647 , G06K2209/01
Abstract: 本发明提供一种图像辨别装置及图像检索装置。预处理部(120)对所输入的图像数据进行2值化,算出整体黑像素比例。在特征抽出部(121)中,检索2值图像数据中所包含的连通区域,并检索外接于该连通区域的外接矩形。对于所检测到的外接矩形,基于外接矩形的大小和矩形黑像素比例,从全部的连通区域中去除规定的连通区域。使用去除了不需要的结合像素之后的剩余的连通区域,来生成以外接矩形的大小为级别、以连通区域数为次数的柱状图。辨别部(122),基于与所生成的柱状图相关联的信息、和上述整体黑像素比例,来辨别所输入的图像数据是文档图像数据还是非文档图像数据。
-
公开(公告)号:CN101354704B
公开(公告)日:2011-01-12
申请号:CN200710129607.X
申请日:2007-07-23
Applicant: 夏普株式会社
CPC classification number: G06F17/30253 , G06K9/723 , G06K2209/01 , G06K2209/011
Abstract: 本发明提供一种字形特征字典制作装置和具备该装置的文档图像处理装置,其中,抽取出文档图像中的文字数为M个的文字列的图像,并将其分割成单个文字而抽出各文字图像的图像特征,基于该图像特征,从将文字图像的图像特征以单个文字为单位储存着的字形特征字典(15)中,按匹配度从高到低的顺序,选择出N个文字图像作为候补文字,其中N为N>1的整数,制作所抽取出的文字列的文字数M×N维的第1索引矩阵。对于由构成该第1索引矩阵的第1列的两个或两个以上候补文字构成的候补文字列,适用基于预定的语言模型的词汇解析,制作将候补文字列调整成有意义的文字列的第2索引矩阵,并用于检索中。由此,可使检索精度进一步提高。
-
公开(公告)号:CN101930545A
公开(公告)日:2010-12-29
申请号:CN200910146369.2
申请日:2009-06-24
Applicant: 夏普株式会社
CPC classification number: G06K9/00416 , G06F1/1626 , G06F1/1643 , G06F1/169 , G06F3/04883 , G06K9/00422
Abstract: 本发明公开了一种手写识别方法和设备,能够对用户连续手写输入的字符序列进行识别,为用户提供方便。该方法包括以下步骤:计算输入字符序列的各种特征,包括它的各种笔画组合的单字识别正确度特征和空间几何特征;采用概率模型,来计算各种切分方式中的各个笔画组合的切分可信度,概率模型中的各项系数,通过对已有样本的训练,采用参数估计方法来估计;在进行笔画组合的单字识别时,采用多模板匹配的方法来识别多种不同写法的字符;搜索出最佳的切分路径;进行后处理,对识别结果进行优化。本发明的方法和设备具有结构简单、硬件要求低、识别速度快,识别率高等优点,可在嵌入式系统等上实现。
-
公开(公告)号:CN101354703B
公开(公告)日:2010-11-17
申请号:CN200710129606.5
申请日:2007-07-23
Applicant: 夏普株式会社
CPC classification number: G06F17/30253 , G06K9/723 , G06K2209/01 , G06K2209/011
Abstract: 本发明提供一种文档图像处理装置及文档图像处理方法。其中,抽取出文档图像中的文字数为M的文字列的图像,将其以1个文字为单位进行分割,并抽出各文字图像的图像特征,基于该图像特征,从以单个文字为单位储存有文字图像的图像特征的字形特征字典(15)中,按照匹配度从高到低的顺序选择N(N>1的整数)个文字图像作为候补文字,而制作抽取出的文字列的文字数为M×N维的第1索引矩阵。并且,对于由构成该第1索引矩阵的第1列的两个或两个以上候补文字构成的候补文字列,通过适用基于预定的语言模型的词汇解析,来制作出调整成有意义的文字列的第2索引矩阵,并在语言模型的基础上统计后进行词汇解析。
-
-
公开(公告)号:CN101488129A
公开(公告)日:2009-07-22
申请号:CN200810000707.7
申请日:2008-01-14
Applicant: 夏普株式会社
CPC classification number: G06K9/4647
Abstract: 本发明提供一种图像检索装置及图像检索方法。若在灰度处理部(11)中转换成灰度图像数据,则直方图生成部(12)生成表示上述灰度图像数据的像素数分布的直方图。基于关注像素的浓淡度和以大致圆周状地包围关注像素的多个周边像素的浓淡度,针对各像素计算出旋转不变的特征量,并基于所计算出的特征量生成直方图,其中该旋转不变的特征量表示以关注像素为中心的局部的纹理特征。检索部(15),基于登记图像数据的直方图和输入图像数据的直方图,检索相似的图像数据,显示部(16)显示检索结果。
-
公开(公告)号:CN101324878A
公开(公告)日:2008-12-17
申请号:CN200710111842.4
申请日:2007-06-15
Applicant: 夏普株式会社
Abstract: 公开了一种适用于包括单词词典的对象语言文字输入系统的新单词自动学习方法,包括:采集步骤,从输入的对象语言语料中采集新单词词典和单词词典中没有的字串作为采集字串,所述新单词词典用于保存所述单词词典中没有的单词;第一保存步骤,将所述采集字串中没有存在于临时新字串词典中的采集字串作为临时新字串保存在临时新字串词典中,以及将存在于所述临时新字串词典中但没有存在于新字串词典中的采集字串作为新字串保存在新字串词典中;以及第二保存步骤,在利用对象语言文字输入系统进行对象语言文字输入过程中用户选择被作为输入候选项呈现的、所述新字串词典中的新字串时,将该新字串作为新单词保存在所述新单词词典中。
-
公开(公告)号:CN101226596A
公开(公告)日:2008-07-23
申请号:CN200710000961.2
申请日:2007-01-15
Applicant: 夏普株式会社
CPC classification number: G06K9/4671 , G06K9/481 , G06K2209/01
Abstract: 本发明的文档图像处理装置,抽取出文档图像中的文字数为M的文字列的图像,将其按单个文字进行分割图像,并抽出各文字图像的图像特征,基于该图像特征,从以单个文字为单位的储存有字库中所有文字图像的图像特征的字形特征字典中,按照匹配度从高到低的顺序,选择出N个文字图像作为候补文字,其中N为N>1的整数,并制作成抽取出的文字列的文字数M×N维索引矩阵。在检索时,以所输入的检索式中的构成检索关键词的单个检索文字为单位,检索索引信息储存部,并取出具有包含检索文字的索引矩阵的文档图像。由此,可提供一种具有不需要用户的手动操作的索引制作功能,且不需要采用OCR识别即可进行高精度检索的文档图像处理装置以及方法。
-
公开(公告)号:CN102479196B
公开(公告)日:2014-09-10
申请号:CN201010560580.1
申请日:2010-11-23
Applicant: 夏普株式会社
IPC: G06F17/30
Abstract: 本发明目的是提供摘要生成装置和摘要生成方法,通过考虑具有多个词义的单词而能够生成适当的摘要。在摘要生成装置(100)中设有:存储文章数据的文章数据存储部(10);对由文章数据表示的文章中的多个单词,基于该文章数据统计各单词的词频,当文章中的单词具有多个词义时,按照每个词义作为不同的副单词处理,统计与各副单词对应的词频的词频统计部(20);基于文章数据和表示文章中的单词和副单词中词频最高者的数据来选择文章中的多个句子,从而生成摘要数据的句子选择部(30)。
-
-
-
-
-
-
-
-
-