-
公开(公告)号:CN102289667B
公开(公告)日:2016-01-13
申请号:CN201110137913.4
申请日:2011-05-16
Applicant: 微软技术许可有限责任公司
CPC classification number: G06K9/033
Abstract: 本发明涉及对经历光学字符识别(OCR)过程的文本文档中出现的错误的用户纠正。通过经历OCR过程来创建图像文档的电子模型。电子模型包括图像文档的已经由OCR过程中多个顺序执行的阶段的每一个所确定的元素(例如,单词、文本行、段落、图像)。电子模型充当由处理该图像文档的前一阶段提供给各个阶段的输入信息。向用户呈现图形用户界面,使用户能提供对文档中出现的错误表征的项进行纠正的用户输入数据。基于用户输入数据,产生了引起错误表征的项的初始错误的处理阶段对该初始错误进行纠正。然后,该阶段之后的OCR过程的各阶段对由于初始错误而在它们的相应阶段中产生的随之发生的错误进行纠正。
-
公开(公告)号:CN102714692B
公开(公告)日:2015-12-16
申请号:CN201080042348.7
申请日:2010-08-28
Applicant: 微软技术许可有限责任公司
CPC classification number: H04N5/23293 , G06K9/3216 , H04N1/00251 , H04N1/00307
Abstract: 描述了基于照相机的扫描的各实施例。在各实施例中,可使用由与设备相关联的照相机拍摄的图像来创建扫描的文档。处理由照相机拍摄的图像以标识图像内与诸如纸、名片、白板、屏幕等矩形对象相对应的部分。可选择这些部分中的一个或多个以用来基于评分方案自动地扫描和/或在来自用户的输入的帮助下半自动地扫描。通过展开所选部分以消除透视效应(例如,将该部分调整为矩形)以及应用各种图像增强以改进外观来从所选的部分中创建一个或多个扫描的文档。
-
公开(公告)号:CN106575357B
公开(公告)日:2020-04-17
申请号:CN201580041095.4
申请日:2015-07-22
Applicant: 微软技术许可有限责任公司
Abstract: 公开了涉及确定眼睛的估计的瞳孔区域的实施例。在一个实施例中,一种方法包括接收眼睛的图像,该图像包括多个像素。粗略的瞳孔区域可使用多个像素的至少一个子集来生成。多个瞳孔边界点候选被提取自粗略的瞳孔区域,其中候选中的每一个基于至少两个相邻像素的颜色值被加权。参数曲线可被拟合到经加权的瞳孔边界点候选,以确定用户眼睛的估计的瞳孔区域。
-
公开(公告)号:CN106575357A
公开(公告)日:2017-04-19
申请号:CN201580041095.4
申请日:2015-07-22
Applicant: 微软技术许可有限责任公司
Abstract: 公开了涉及确定眼睛的估计的瞳孔区域的实施例。在一个实施例中,一种方法包括接收眼睛的图像,该图像包括多个像素。粗略的瞳孔区域可使用多个像素的至少一个子集来生成。多个瞳孔边界点候选被提取自粗略的瞳孔区域,其中候选中的每一个基于至少两个相邻像素的颜色值被加权。参数曲线可被拟合到经加权的瞳孔边界点候选,以确定用户眼睛的估计的瞳孔区域。
-
-
-