一种面向军工科研生产数据的字符识别方法及系统

    公开(公告)号:CN113936282A

    公开(公告)日:2022-01-14

    申请号:CN202111221209.7

    申请日:2021-10-20

    Abstract: 本发明实施例提供一种面向军工科研生产数据的字符识别方法包括:获取基于预处理后的军工科研生产数据,采用文本检测技术框选出图像的文本区域,对文本区域进行字符识别后输出的每个字符的初始识别结果以及识别准确率;获取被抽取字符所对应的文本区域的初始图像,基于预设判别标准,通过预设辨别模块初始图像进行判别;若预设辨别模块的判别结果与初始识别结果一致,则确定初始识别结果正确;若预设辨别模块的判别结果与初始识别结果不一致,则确定初始识别结果错误;被抽取字符的抽取概率基于文档识别要求、字符数量、每个字符的识别准确率以及识别错误频次确定。结合文档识别要求和字符的识别准确率,随机抽取字符下进行识别,提升校对效率。

    一种面向军工科研生产数据的字符识别方法及系统

    公开(公告)号:CN113936282B

    公开(公告)日:2025-04-25

    申请号:CN202111221209.7

    申请日:2021-10-20

    Abstract: 本发明实施例提供一种面向军工科研生产数据的字符识别方法包括:获取基于预处理后的军工科研生产数据,采用文本检测技术框选出图像的文本区域,对文本区域进行字符识别后输出的每个字符的初始识别结果以及识别准确率;获取被抽取字符所对应的文本区域的初始图像,基于预设判别标准,通过预设辨别模块初始图像进行判别;若预设辨别模块的判别结果与初始识别结果一致,则确定初始识别结果正确;若预设辨别模块的判别结果与初始识别结果不一致,则确定初始识别结果错误;被抽取字符的抽取概率基于文档识别要求、字符数量、每个字符的识别准确率以及识别错误频次确定。结合文档识别要求和字符的识别准确率,随机抽取字符下进行识别,提升校对效率。

    基于知识图谱的军工科研生产数据相似性判别方法及系统

    公开(公告)号:CN113934864A

    公开(公告)日:2022-01-14

    申请号:CN202111221214.8

    申请日:2021-10-20

    Abstract: 本发明实施例提供一种基于知识图谱的军工科研生产数据相似性判别方法及系统,包括构建本体体系,包括构建产生军工科研生产数据的本体以及本体之间的第一关联关系,其中,本体包括多种元素;构建知识图谱,包括基于本体体系,从原始文件中提取实体以及每个原始文件中所包含实体之间的第二关联关系,并在进行实体对齐和关联关系推理后,生成原始文件对应的知识图谱,其中,实体为本体的多种元素中的至少一种;构建知识子图,包括基于知识图谱,抽取获得待判别文件中每个待判别文件的实体的数量信息和第二关联关系的数量信息,确定每个待判别文件的知识子图;基于每个待判别文件的知识子图,判别待判别文件的相似性。

Patent Agency Ranking