-
公开(公告)号:CN117891862A
公开(公告)日:2024-04-16
申请号:CN202311721127.8
申请日:2023-12-14
Applicant: 中国科学院自动化研究所
IPC: G06F16/25 , G06F16/22 , G06F16/23 , G06V10/764 , G06Q40/12 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种业财数据转换方法、装置、电子设备及存储介质,应用于财会技术领域。该方法包括:获取待处理票据的票据图像;识别所述票据图像中的票据信息;基于预设分类模型确定所述票据信息对应的目标经济事项,基于会计科目映射库确定所述目标经济事项对应的目标会计科目;根据所述目标经济事项和所述目标会计科目生成所述待处理票据的财务记账凭证;其中,所述预设分类模型用于预测输入的票据信息对应的经济事项,所述会计科目映射库包括经济事项与会计科目之间的映射关系。
-
公开(公告)号:CN110084117B
公开(公告)日:2021-07-20
申请号:CN201910223004.9
申请日:2019-03-22
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于文本图像识别技术领域,具体涉及一种基于二值图分段投影的文档表格线检测方法、系统,旨在为了解决解决文档图像图像质量不稳定带来的表格线识别的准确度和鲁棒性不足的问题。本发明方法包括:输入图像的二值化处理;沿水平方向切分等宽等长的矩形子图,并计算各像素行投影值;获取各子图中表示表格线段的矩形框;基于所有子图,获取表格线候选路径;依据长度信息选择表格线候选路径对应的矩形框得到第一表格线集合,对第一图像旋转后经上述方法得到表格线,你旋转后得到第二表格线集合。本发明且不会受到具体表格类型的影响,具有较好的通用性,且对文档图像图像质量不稳定情况下进行表格线识别,提高了识别准确度和鲁棒性。
-
公开(公告)号:CN108805033B
公开(公告)日:2020-12-18
申请号:CN201810492704.3
申请日:2018-05-22
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于模式识别领域,具体涉及一种基于局部梯度分布的拍摄图像优选方法及装置,旨在解决如何在获取的多张目标文档的图像中快速准确地选择出最清晰的一张图像的问题。为此目的,本发明提供的优选方法包括:获取目标文档的多张尺寸一致的拍摄图像,并设置多个大小一致的第一候选框;计算每个第一候选框内图像的第一边缘信息强度,根据第一边缘信息强度的降序选取第二候选框;对目标文档的每张拍摄图像,计算每张所述拍摄图像的第一评估值和第二评估值;从第一评估值最高的图像和第二评估值最高的图像中选取满足预设条件的图像,并作为优选拍摄图像。本发明提供的优选方法适用于多种类型的文档图像,对于文档图像识别性能的提高有着重要意义。
-
公开(公告)号:CN106570521B
公开(公告)日:2020-04-28
申请号:CN201610924239.7
申请日:2016-10-24
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种多语言场景字符识别方法及识别系统。其中,该方法可以包括:确定场景字符图像中字符的语言类型;根据字符的语言类型,确定深度卷积神经网络模型;利用深度卷积神经网络模型,来提取场景字符图像的卷积层特征;基于卷积层特征,建立空间金字塔模型;利用高斯模型在空间金字塔模型上对每一空间区域进行高阶编码;将高阶编码后的结果拼接起来,作为场景字符描述子;利用分类器对场景字符描述子进行分类,以实现多语言场景字符的识别。本发明实施例对多语言的场景字符图像具有很好的识别效果,是一种通用的字符识别方法,对多语言场景文字识别具有良好的适应性。
-
公开(公告)号:CN110059572A
公开(公告)日:2019-07-26
申请号:CN201910222318.7
申请日:2019-03-22
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于文本图像识别技术领域,具体涉及一种基于单字匹配的文档图像中文关键词检测方法、系统,旨在解决解决文档图像图像质量不稳定及汉字排列多样性带来的中文关键词识别的准确度和鲁棒性不足的问题,本发明方法包括:对文档图像进行二值化处理得到第一图像;进行字符检测得到第一候选字符集合;对第一候选字符集合进行过滤得到第二候选字符集合、第一噪声候选字符集合;从第一噪声候选字符集合筛选字符并添加至第二候选字符集合,得到第三候选字符集合;进行候选字符组合得到第一候选词集合;进行丢失字符的二次检测得到第二候选词集合;基于代价函数,选择最终的关键词检测结果。本发明提高了文档关键词识别的准确度,具有高鲁棒性。
-
公开(公告)号:CN108805033A
公开(公告)日:2018-11-13
申请号:CN201810492704.3
申请日:2018-05-22
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于模式识别领域,具体涉及一种基于局部梯度分布的拍摄图像优选方法及装置,旨在解决如何在获取的多张目标文档的图像中快速准确地选择出最清晰的一张图像的问题。为此目的,本发明提供的优选方法包括:获取目标文档的多张尺寸一致的拍摄图像,并设置多个大小一致的第一候选框;计算每个第一候选框内图像的第一边缘信息强度,根据第一边缘信息强度的降序选取第二候选框;对目标文档的每张拍摄图像,计算每张所述拍摄图像的第一评估值和第二评估值;从第一评估值最高的图像和第二评估值最高的图像中选取满足预设条件的图像,并作为优选拍摄图像。本发明提供的优选方法适用于多种类型的文档图像,对于文档图像识别性能的提高有着重要意义。
-
公开(公告)号:CN104318215B
公开(公告)日:2017-09-19
申请号:CN201410583974.7
申请日:2014-10-27
Applicant: 中国科学院自动化研究所
Abstract: 本发明一种基于域鲁棒卷积特征学习的交叉视角人脸识别方法,包括步骤S1:从源域和目标域人脸集中采集多个人脸图像组成虚拟域人脸集;步骤S2:训练出源域、虚拟域和目标域的卷积深度神经网络;分别组成源域、目标域人脸集的人脸图像的卷积特征;步骤S3:建立源视角映射矩阵和目标视角映射矩阵,获得源域、目标域人脸集的人脸图像的卷积特征在映射空间中相应的源域、目标域新人脸特征值;步骤S4:优化源视角映射矩阵和目标视角映射矩阵;步骤S5:计算测试人脸图片的卷积特征并输入映射矩阵,得到并在一个新人脸特征值与多个新人脸特征之间的多个距离中选择最小距离对应的测试源视角人脸图像的身份作为测试目标视角人脸图像的身份。
-
公开(公告)号:CN106570521A
公开(公告)日:2017-04-19
申请号:CN201610924239.7
申请日:2016-10-24
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种多语言场景字符识别方法及识别系统。其中,该方法可以包括:确定场景字符图像中字符的语言类型;根据字符的语言类型,确定深度卷积神经网络模型;利用深度卷积神经网络模型,来提取场景字符图像的卷积层特征;基于卷积层特征,建立空间金字塔模型;利用高斯模型在空间金字塔模型上对每一空间区域进行高阶编码;将高阶编码后的结果拼接起来,作为场景字符描述子;利用分类器对场景字符描述子进行分类,以实现多语言场景字符的识别。本发明实施例对多语言的场景字符图像具有很好的识别效果,是一种通用的字符识别方法,对多语言场景文字识别具有良好的适应性。
-
公开(公告)号:CN103345623B
公开(公告)日:2016-09-21
申请号:CN201310290428.X
申请日:2013-07-11
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种基于鲁棒相对属性的行为识别方法。该方法包括以下步骤:提取视频样本库中每个动作视频样本的特征向量;设定对应于多种人体行为的多个人体运动属性,以及在每个人体运动属性下,每两个代表人体行为的动作视频,即动作视频对之间的关系;将所述动作视频对之间的关系作为输入,利用排序支持向量机进行训练,得到训练模型;利用梯度下降法求解所述排序支持向量机,得到所述排序支持向量机的参数向量,进而得到最优训练模型;利用得到的最优训练模型对每个待测试的动作视频进行人体行为识别,得到人体行为识别结果。实验证明,本发明方法能够提高人体行为识别的鲁棒性。
-
公开(公告)号:CN103226713B
公开(公告)日:2016-04-13
申请号:CN201310181275.5
申请日:2013-05-16
Applicant: 中国科学院自动化研究所
IPC: G06K9/64
Abstract: 本发明公开了一种多视角行为识别方法。该方法包括以下步骤:对每个视角的动作视频样本提取其局部和全局特征,并把每个动作视频样本表示成为一个特征向量;对源视角和目标视角的动作视频样本的变换矩阵进行初始化;然后在信息论的框架下求得源视角和目标视角的动作视频样本的变换矩阵;根据两个视角的动作视频样本的变换矩阵求得虚拟视角核;然后求得每个动作视频样本之间的相似度;最后使用支持向量机分类器对测试动作视频进行分类。本发明通过连接在源视角和目标视角的连续通路达到多视角行为识别的目的;通过虚拟视角核计算得到的相似度矩阵能够作为任何基于核分类器的输入。
-
-
-
-
-
-
-
-
-