-
公开(公告)号:CN117576703A
公开(公告)日:2024-02-20
申请号:CN202311607242.2
申请日:2023-11-29
IPC: G06V30/19 , G06V30/262 , G06V30/164 , G06V30/162 , G06V30/148 , G06F16/33 , G06F16/35 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种数字标准文献OCR自动识别的方法,包括获取文献图片,对所述文献图片进行预处理,提取预处理后的所述文献图片的文本,对所述文本进行去停用词和分词处理获得多个初始词,根据多个所述初始词提取关键词,计算文本的所述关键词相似度,根据所述相似度构建卷积神经网络模型,优化所述卷积神经网络模型,调整优化后的所述卷积神经网络模型的权重,将不同初始词所述关键词输入所述卷积神经网络模型,按相似度大于0.85对所述文本进行分类并存储,输出分类结果。该方法不仅可以提高自动识别精度,同时具有较好的可解释性,可以直接应用于数字标准文献OCR自动识别系统中。
-
公开(公告)号:CN117668156A
公开(公告)日:2024-03-08
申请号:CN202311607976.0
申请日:2023-11-29
IPC: G06F16/33 , G06F16/35 , G06F40/295 , G06F40/216 , G06F18/24 , G06N3/0464 , G06N3/048 , G06N3/08 , G06N7/01
Abstract: 本发明公开了一种基于标准知识图谱的文本提取方法,包括获取待提取文本,对所述待提取文本进行预处理,提取预处理后的所述待提取文本的关键词,将所述关键词输入识别模型识别命名实体,计算所述命名实体与现有知识图谱实体的相关性,根据所述相关性对所述命名实体与现有的知识图谱实体进行匹配,根据所述匹配获得链接实体,将所述链接实体输入第一算法抽取初始属性,将所述初始属性输入第二算法抽取属性,根据所述属性抽取实体之间的关系,根据所述关系对实体进行聚类,根据所述聚类进行文本提取。该方法不仅可以提高文本提取精度,同时具有较好的可解释性,可以直接应用于标准知识图谱文本提取系统中。
-
公开(公告)号:CN119539077A
公开(公告)日:2025-02-28
申请号:CN202411596886.0
申请日:2024-11-11
Applicant: 国网山东省电力公司济南供电公司 , 中国标准化研究院
Abstract: 本发明公开了基于知识图谱的电力领域标准数字化推理模型的构建方法,涉及电数字数据处理技术领域。该基于知识图谱的电力领域标准数字化推理模型的构建方法,包括以下步骤:数据收集;知识图谱构建;模型构建验证;模型优化。本发明通过电力标准数据和电力知识数据构建电力标准知识图谱,然后基于电力领域的预设推理规则并结合电力标准知识图谱的电力性能参数构建数字化推理模型,并进行模型验证得到模型验证结果,接着实时监测电力领域在预设时间间隔内的电力领域并获取电力变化度并进行优化,达到了提高模型构建过程中知识图谱的数据利用率的效果,解决了现有技术中存在模型构建过程中知识图谱的数据利用不充分的问题。
-
公开(公告)号:CN117112808A
公开(公告)日:2023-11-24
申请号:CN202311378410.5
申请日:2023-10-24
Applicant: 中国标准化研究院
Abstract: 本申请公开了一种信用失信主体的信息知识图谱构建方法,在检测到信用失信主体的待定行为时,基于本次待定行为可能存在的风险,对知识图谱进行更新,为基于更新后的知识图谱对待定行为的风险进行预测提供条件。也就是说,本说明书中的方法能够对知识图谱进行具有预测性质的、体现出“极致及时性”的更新,进而有利于及时地识别待定行为的风险。一方面,通过以管理、监督目的的数据处理,实现了信用失信主体的信息知识图谱构建。另一方面,得到的信息知识图谱构建有利于实现风险的及时预测,为进一步地减少监督、管理资源的消耗提供了条件。
-
公开(公告)号:CN118053007B
公开(公告)日:2024-07-12
申请号:CN202410457095.3
申请日:2024-04-16
Applicant: 中国标准化研究院
Abstract: 本发明涉及标准内容比对技术领域,具体公开一种基于大数据的标准内容比对展示方法及系统,该方法包括:收集产品的各类相关标准实物图像,从通用性角度对各类相关标准进行归类分级;获取现行标准相关数据,分析得到现行标准的通用性适配指标,根据现行标准的通用性适配指标匹配得到现行标准的适配通用性等级,并与所述各通用性等级的各类属相关标准进行匹配,得到各目标比对标准,将现行标准与各目标比对标准进行标准内容比对,并将比对结果进行展示。本发明通过对带有产品实物图像的标准内容进行比对分析,可以提高标准内容比对的信息准确性和完整性,提升标准比对效率和质量控制效果。
-
公开(公告)号:CN117787296A
公开(公告)日:2024-03-29
申请号:CN202410205317.2
申请日:2024-02-26
Applicant: 中国标准化研究院
Abstract: 本申请公开了一种基于机器学习的英语标准内容自动翻译方法及系统,采用了技术的手段,一方面结合了至少两个翻译模型的翻译能力,对翻译模型的翻译水平进行了衡量;另一方面,即便是翻译模型的能力存在不足,也能够得到一定程度上可用的目标翻译结果。本申请的方法及系统通过基于特定计算模型的计算机技术,实现了翻译。也为进一步地减少监督、管理资源的消耗提供了条件。
-
公开(公告)号:CN119179789A
公开(公告)日:2024-12-24
申请号:CN202411219353.0
申请日:2024-09-02
Applicant: 中国标准化研究院
IPC: G06F16/36 , G06F16/35 , G06F16/34 , G06F40/30 , G06F40/289 , G06F40/216 , G06N5/022
Abstract: 本发明公开了一种基于知识图谱的标准信息管理方法及系统,涉及标准信息管理技术领域。该方法包括以下步骤:获取待构建知识图谱的模式层;生成知识图谱;获取标准信息数据;知识图谱的迭代优化。本发明通过收集预设时间段内待管理的信息数据并进行预处理以获取待构建知识图谱的模式层,然后对待构建知识图谱的模式层进行概念抽象并结合对应的本体结构和知识关联性指数生成对应的知识图谱,最后对知识图谱中的知识关系信息进行更新以获取标准信息数据,同时结合用户的反馈结果和预设的标准信息指标对构建的知识图谱进行迭代优化,达到了提高标准信息数据获取准确度的效果,解决了现有技术中存在标准信息数据获取准确度低的问题。
-
公开(公告)号:CN119025645A
公开(公告)日:2024-11-26
申请号:CN202411087724.4
申请日:2024-08-09
Applicant: 中国标准化研究院
IPC: G06F16/332 , G06F16/36
Abstract: 本发明涉及电子数据抽取处理技术领域,具体公开一种标准知识自动化抽取方法,该方法包括:获取与预处理待抽取数据、标准知识元素抽取与分析、标准知识元素抽取验证、标准知识元素存储;通过对初步的标准文献数据库数字化数据进行预处理,可以提高数据的准确性、完整性以及标准文献数据库数字化数据的质量,对标准知识元素的抽取进行验证,确保所抽取的标准知识元素与标准文献数据库中的知识元素相匹配,提高知识抽取的准确性和可靠性,对标准知识元素进行备份加密存储,可以有效防止未经授权的访问和窃取标准知识元素,同时对标准知识元素进行备份,确保在标准知识元素丢失或损坏时,可以迅速恢复,保障标准知识元素的完整性。
-
公开(公告)号:CN117787296B
公开(公告)日:2024-05-07
申请号:CN202410205317.2
申请日:2024-02-26
Applicant: 中国标准化研究院
Abstract: 本申请公开了一种基于机器学习的英语标准内容自动翻译方法及系统,采用了技术的手段,一方面结合了至少两个翻译模型的翻译能力,对翻译模型的翻译水平进行了衡量;另一方面,即便是翻译模型的能力存在不足,也能够得到一定程度上可用的目标翻译结果。本申请的方法及系统通过基于特定计算模型的计算机技术,实现了翻译。也为进一步地减少监督、管理资源的消耗提供了条件。
-
公开(公告)号:CN117112808B
公开(公告)日:2024-01-19
申请号:CN202311378410.5
申请日:2023-10-24
Applicant: 中国标准化研究院
Abstract: 本申请公开了一种信用失信主体的信息知识图谱构建方法,在检测到信用失信主体的待定行为时,基于本次待定行为可能存在的风险,对知识图谱进行更新,为基于更新后的知识图谱对待定行为的风险进行预测提供条件。也就是说,本说明书中的方法能够对知识图谱进行具有预测性质的、体现出“极致及时性”的更新,进而有利于及时地识别待定行为的风险。一方面,通过以管理、监督目的的数据处理,实现了信用失信主体的信息知识图谱构建。另一方面,得到的信息知识图谱构建有利于实现风险的及时预测,为进一步地减少监督、管理资源的消耗提供了条件。
-
-
-
-
-
-
-
-
-