-
公开(公告)号:CN107247950A
公开(公告)日:2017-10-13
申请号:CN201710416957.8
申请日:2017-06-06
Applicant: 电子科技大学
CPC classification number: G06K9/2054 , G06K9/4604 , G06K9/6256 , G06K9/6269
Abstract: 本发明公开了一种基于机器学习的身份证图像文本识别方法,属于图像处理,机器视觉,神经网络等技术领域,解决现有技术中OCR识别在复杂背景下进行身份证图像自动识别时,识别时间长、识别的准确率低、抗旋转,扭曲性差的问题。本发明包括获取拍摄的图像,将拍摄的图像进行预处理,将预处理后的图像中的身份证图像和复杂的背景图像区分开;对检测出来的身份证图像进行文字区域检测,然后对检测出来的文字区域进行文字切割,得到一个一个文字;基于深度学习的字符识别模型对切分出来的文字进行识别,输出识别出来的结果。本发明用于身份证图像上的文本识别。
-
公开(公告)号:CN106095443B
公开(公告)日:2019-04-05
申请号:CN201610412437.5
申请日:2016-06-14
Applicant: 电子科技大学
IPC: G06F8/30
Abstract: 没本发明公开了一种基于C/C++代码库的API调用模式挖掘方法。本方法的输入是C/C++代码库,首先通过开源的基于LLVM的clang编译器对输入代码库进行编译,利用clang提供的相关扩展接口完成API序列信息的提取;然后对API序列进行预处理,将相同的API序列合并成一条序列及将嵌套使用的序列进行关联处理;然后将预处理好的API序列存储到数据库中;然后计算数据库中API序列间的距离,得到距离矩阵;然后根据API序列间的距离矩阵,使用DBScan聚类算法对API序列进行聚类处理,将聚类结果存储到数据库中;最后用户输入函数片段信息,利用数据库查询技术将符合要求的API序列及对应的使用代码片段返回给用户。
-
公开(公告)号:CN106095443A
公开(公告)日:2016-11-09
申请号:CN201610412437.5
申请日:2016-06-14
Applicant: 电子科技大学
IPC: G06F9/44
CPC classification number: G06F8/30
Abstract: 没本发明公开了一种基于C/C++代码库的API调用模式挖掘方法。本方法的输入是C/C++代码库,首先通过开源的基于LLVM的clang编译器对输入代码库进行编译,利用clang提供的相关扩展接口完成API序列信息的提取;然后对API序列进行预处理,将相同的API序列合并成一条序列及将嵌套使用的序列进行关联处理;然后将预处理好的API序列存储到数据库中;然后计算数据库中API序列间的距离,得到距离矩阵;然后根据API序列间的距离矩阵,使用DBScan聚类算法对API序列进行聚类处理,将聚类结果存储到数据库中;最后用户输入函数片段信息,利用数据库查询技术将符合要求的API序列及对应的使用代码片段返回给用户。
-
-