-
公开(公告)号:CN117891503A
公开(公告)日:2024-04-16
申请号:CN202311696266.X
申请日:2023-12-11
Applicant: 中国科学院自动化研究所
IPC: G06F8/75
Abstract: 本发明提供一种元素自动探测方法、装置、电子设备及存储介质,应用于数据自动化技术领域。该方法包括:基于用户输入获取目标元素;逐层确定所述目标元素的所有父级节点,并确定所述所有父级节点的序列表示,得到目标序列;对所述目标序列进行层级解析得到目标解析语句,并执行所述目标解析语句得到所述目标元素。
-
公开(公告)号:CN111583156A
公开(公告)日:2020-08-25
申请号:CN202010403455.3
申请日:2020-05-13
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种文档图像底纹去除方法及系统,所述去除方法包括:对原始文档图像进行二值化处理,得到二值化图像;提取二值化图像的边缘,得到边缘图像;融合边缘图像的设定距离的边缘,得到融合图像;根据融合图像及边缘图像,得到底纹纹理图;将原始文档图像等分成多个图像块;从图像块的各像素点中提取对应在所述底纹纹理图中被标记为底纹像素点的第一像素点;计算各第一像素点的像素值的均值,得到图像块的纹理均值;计算像素点的像素值与纹理均值之间的距离值;当距离值小于或等于颜色距离阈值,则将像素点对应的二值化图像中的像素点置零,得到二值化结果图像,在去除底纹的同时能有效的保留文档中被底纹干扰的文本信息。
-
公开(公告)号:CN103279753B
公开(公告)日:2016-03-09
申请号:CN201310230927.X
申请日:2013-06-09
Applicant: 中国科学院自动化研究所
IPC: G06K9/20
Abstract: 本发明公开一种基于结构指导的英文场景文本块识别方法,S1在部件上对每类字符建立树结构,并为每类字符训练一个用于检测出该类字符结构的字符树结构模型;S2在待识别的文本块图像中使用每类字符树结构模型对每类字符进行检测,得到所有类别字符的检测结果;S3对检测结果进行非极大值抑制,抑制检测分数低的检测结果,保留检测分数高的检测结果,这些保留的检测结果所在位置代表了候选字符所在的位置,将这些候选字符中的每个候选字符所在的位置设为一个节点,利用这些节点建立条件随机场;S4为条件随机场定义损失函数,所述损失函数包括一元损失函数和二元损失函数;S5对损失函数做最小化处理,得到最终的文本块识别结果。
-
公开(公告)号:CN104537362A
公开(公告)日:2015-04-22
申请号:CN201510022065.0
申请日:2015-01-16
Applicant: 中国科学院自动化研究所
CPC classification number: G06K9/6821
Abstract: 本发明是一种基于域自适应的英文场景文字识别方法,其包括步骤:1、建立位置嵌入词典;2)基于位置嵌入词典的编码和抽取;3)中间域词典的学习;4)文字分类器的训练和测试。本发明方法先通过建立位置嵌入词典解决传统图像金字塔无法应用于场景文字识别的问题,之后通过非监督词典学习方法对训练域和目标域的分布差异进行内插,从而实现域自适应的英文场景文字识别。
-
公开(公告)号:CN103473538A
公开(公告)日:2013-12-25
申请号:CN201310432350.0
申请日:2013-09-22
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种基于样例迁移学习的人体检测方法,该方法包括以下步骤:提取训练集中正样本和负样本的多维人体特征;利用支持向量机进行训练,得到初始人体检测器;将人体检测器划分为多个小网格,每个网格代表一个小部件,并用相应网格里的权重来表示这个部件;对于网格权重进行更新;采用多尺度滑动框扫描的方式对于待检测图像进行人体检测,得到人体检测结果。本发明中的检测器能够自适应的进行结构调整与测试框里的样例的结构进行匹配,并将匹配的损失计入得分函数中,因此本发明方法能够自适应地对每个样例进行结构迁移,可以处理人体的形变等情况。
-
公开(公告)号:CN103279753A
公开(公告)日:2013-09-04
申请号:CN201310230927.X
申请日:2013-06-09
Applicant: 中国科学院自动化研究所
IPC: G06K9/20
Abstract: 本发明公开一种基于结构指导的英文场景文本块识别方法,S1在部件上对每类字符建立树结构,并为每类字符训练一个用于检测出该类字符结构的字符树结构模型;S2在待识别的文本块图像中使用每类字符树结构模型对每类字符进行检测,得到所有类别字符的检测结果;S3对检测结果进行非极大值抑制,抑制检测分数低的检测结果,保留检测分数高的检测结果,这些保留的检测结果所在位置代表了候选字符所在的位置,将这些候选字符中的每个候选字符所在的位置设为一个节点,利用这些节点建立条件随机场;S4为条件随机场定义损失函数,所述损失函数包括一元损失函数和二元损失函数;S5对损失函数做最小化处理,得到最终的文本块识别结果。
-
公开(公告)号:CN102332097B
公开(公告)日:2013-06-26
申请号:CN201110322549.9
申请日:2011-10-21
Applicant: 中国科学院自动化研究所
IPC: G06K9/20
Abstract: 本发明公开了一种基于图割的复杂背景文本图像分割方法,其包括步骤:1)将原始文本块图像粗分为子图;2)通过估计每个子图的极性,最终决定整个文本块图像的极性;3)根据文本块图像的极性,结合字符笔画的固有特征,自动提供一些置信度较高的前景背景点作为图割的硬约束;4)对子图施加相应的软约束,用图割将硬约束传播到整个子图,进而分割子图;5)将分割的子图合并获得整体的文本分割图像。本发明方法采用分-合的技术,具有局部空间自适应性,从而可以应对背景不均匀的复杂背景文本块图像;同时,本方法自动为图割提供硬约束,结合软约束将硬约束扩展到整幅子图,因此对背景复杂的文本图像可以取得较好的分割效果。
-
公开(公告)号:CN101615252B
公开(公告)日:2012-07-04
申请号:CN200810115615.3
申请日:2008-06-25
Applicant: 中国科学院自动化研究所
Abstract: 本发明一种自适应图像文本信息提取方法,涉及图像中的文本信息提取技术,其包括步骤:1)图像预处理;2)图象背景复杂度分析;3)文本初检测;4)文本验证;5)文本抽取;6)文本信息输出或显示。本发明方法,通过计算图像背景复杂度,对不同复杂度背景的图像采用不同的文本检测方法,减少了采用单一文本检测方法中的漏检,误检现象,提高了文本提取系统的整体性能。本发明方法中图像背景复杂度的计算方法简单,有效,不仅能够检测出不同背景复杂度的图像中的文字信息,而且检测出的文本信息不受字体,大小及语言的影响,具有很强的通用性。
-
公开(公告)号:CN101330388B
公开(公告)日:2012-01-04
申请号:CN200710117608.2
申请日:2007-06-20
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开基于综合集成研讨厅的协同编辑方法及系统,方法主要包括初始协同编辑文档的形成与综合集成协同编辑,系统采用C/S或B/S方式;每个客户端通过局域网或互联网与服务器相连;服务器包括消息服务器、数据库服务器、流化媒体服务器和文件服务器,系统提供了一系列从定性到定量的研讨工具。本发明解决了在协同编辑过程中当编辑者遇到较为复杂的情况,单个的编辑者不能确定如何进行编辑,需要多个协同编辑者的群体智慧,共同协商编辑时的一类协同编辑问题,以及用从定性到定量的综合集成研讨厅的方法解决在协同编辑过程中如何协调编辑者的不同意见的问题;本发明可以为多人协作共同编辑文档提供方便。
-
公开(公告)号:CN102222339A
公开(公告)日:2011-10-19
申请号:CN201110163655.7
申请日:2011-06-17
Applicant: 中国科学院自动化研究所
Abstract: 本发明是一种基于纹理和强度特征融合的多尺度背景建模方法。对输入图像序列进行多尺度变换;对每个尺度的图像用尺度不变中心对称的局部三元模式算子表示,用自适应的模式核密度方法计算每个尺度图像中所述模式属于背景的概率,并把累加权值超过纹理比重阈值的概率密度分布作为背景,计算所述模式属于背景的概率;把每个尺度的强度图像表示为强度图像,把权值累加超过强度比重阈值的高斯模型作为背景,用简化的混合高斯模型计算此强度值属于背景的概率;将相同尺度的图像纹理和图像强度进行融合,再将不同尺度的图像进行融合得到属于背景的最终概率,当此概率大于前背景分割阈值时则属于背景,反之则属于前景。
-
-
-
-
-
-
-
-
-