解析doc二进制格式并提取文档中图片的方法及系统

    公开(公告)号:CN108920612A

    公开(公告)日:2018-11-30

    申请号:CN201810687836.1

    申请日:2018-06-28

    Abstract: 本发明提供一种解析doc二进制格式并提取文档中图片的系统及方法,方法包括:S1.以二进制流的方式打开doc文档;S2.从doc的二进制流中获取浮动式图片的存储信息,判断doc文档中是否有浮动图片,若有,则提取浮动式图片;3.从doc的二进制流中获取每个文本段落的文本字符,判断文本字符中是否含有图片占位符;若有,则根据图片占位符信息提取内嵌式图片;S4.采用光学字符识别技术OCR对提取的浮动式图片和内嵌式图片进行处理,获取图片中的文字信息。系统包括doc二进制流打开模块、浮动式图片提取模块、内嵌式图片提取模块以及图片中文字信息提取模块。本发明通过分析二进制格式提取文件,执行效率高,兼容性高。

    一种基于灰度变换隐藏纸质黑白打印敏感数据的方法

    公开(公告)号:CN109145618B

    公开(公告)日:2022-02-22

    申请号:CN201810902669.8

    申请日:2018-08-09

    Abstract: 本发明提供一种基于灰度变换隐藏纸质黑白打印敏感数据的方法,步骤如下:拦截将要发送给打印机的待打印数据;生成n×n位随机二进制数作为隐秘水印码,建立隐秘水印码与打印敏感数据对应关系并存入数据库;创建与待打印数据一致的图形缓冲区;将图形缓冲区划分为若干单位正方形;将图形缓冲区划分为若干大正方形,大正方形由n×n个单位正方形组成作为隐秘水印码存储单元;将隐秘水印码按相同的顺序存储到每个隐秘水印码存储单元;选择隐秘水印码存储单元中至少两个单位正方形做标记;将图形缓冲区中数据与待打印数据合并并打印;根据标记定位出一个隐秘水印码存储单元并读取隐秘水印码;从数据库中查找隐秘水印码对应的打印敏感数据。

Patent Agency Ranking