-
公开(公告)号:CN110990376B
公开(公告)日:2023-05-09
申请号:CN201911140195.9
申请日:2019-11-20
Applicant: 中国农业科学院农业信息研究所
IPC: G06F16/21 , G06F16/22 , G06F16/2458 , G06F16/25
Abstract: 本发明提出一种基于多因子混合排序机制的学科分类自动标引方法,其特征在于:包含以下步骤:1.构建不同数据来源的基础语料库,获取每一个关键词在基础语料库中在对应的所有学科分类号下出现次数、最大次数及概率;2.根据待标引的文献选取相应的基础语料库,预处理待标引文献的关键词,通过对比待标引文献的关键词与基础语料库关键词,对命中的参数依据多因子混合排序机制测算分值并降序排列;3.基于权威文献分类法设计学科滤镜,并通过学科滤镜对步骤2中降序排列的学科分类号进行筛选,缩小学科范围,输出指定Top N个学科分类号;4.将输出的关键词及学科分类号入库基础语料库,进行合并或者修订,提升基础语料库规模和质量。
-
公开(公告)号:CN112560902A
公开(公告)日:2021-03-26
申请号:CN202011383651.5
申请日:2020-12-01
Applicant: 中国农业科学院农业信息研究所
Abstract: 本发明提出一种基于书脊视觉信息的图书识别方法及系统,包括采集图书馆架上图书书脊图片、对其人工标注以构建书脊分割与书脊分类数据集;构建用于书脊图片深度特征提取的卷积神经网络,并利用训练数据进行训练得到特征提取模型;拍摄架上书本的书脊一侧图片,首先对其中的书脊进行实例分割,进而利用已经训练好的模型获取该书脊图片对应的视觉特征向量,然后与馆藏数据库匹配以识别该书脊对应图书的类别。本发明基于深度学习算法对图书的书脊图片进行识别,利用到书脊目标的全部视觉信息,不受限于文字识别方法所依赖的字典集,支持馆藏新增图书,具有更高的准确率和更好的鲁棒性、可扩展性;可对架上系列图书的书脊图片进行批量识别。
-
公开(公告)号:CN111737471A
公开(公告)日:2020-10-02
申请号:CN202010600107.5
申请日:2020-06-28
Applicant: 中国农业科学院农业信息研究所
IPC: G06F16/35 , G06F40/279 , G06F40/30 , G06N5/04
Abstract: 本发明公开了一种基于知识图谱的档案管理模型构建方法及系统,方法包括:获取计算机可读格式的档案文本,识别档案文本中最小的知识单元,基于各个最小的知识单元的相关关系,形成各知识单元间的语义联系;基于各知识单元间的语义联系,通过知识图谱建立动态档案多维度关联模型;根据动态档案多维度关联模型,通过编辑工具、建模语言建立计算机可识别的档案知识图谱语义模型,利用档案知识对齐、知识消歧对档案自身知识进行知识融合,并与档案知识组织模型互相映射,通过知识推理过程对语义关联进行知识更新与替代。本发明提出了通过识别最小的知识单元识别、建立多维度关联模型及知识融合技术,提高档案语义关联度与利用率。
-
公开(公告)号:CN119358775A
公开(公告)日:2025-01-24
申请号:CN202411918500.3
申请日:2024-12-24
Applicant: 中国农业科学院农业信息研究所
IPC: G06Q10/04 , G06Q50/02 , G06N5/025 , G06N5/02 , G06N3/042 , G06N3/0455 , G06N3/08 , G06F18/27 , G06F123/02
Abstract: 本发明涉及作物管理技术领域,公开了一种产量的预测方法、装置、设备、介质及程序产品,方法包括:获取目标地区范围的历史时间内作物的历史产量及产量影响因素的历史参数值;构建产量、影响因素、时间之间的时序知识图谱;将时序知识图谱作为产量时序预测模型的输入,得到目标地区范围内作物的预估产量;基于可解释模型对产量时序预测模型的预测结果进行可解释分析,确定产量影响因素对预估产量的影响程度。本发明通过构建时序知识图谱,并进行模型产量预测和可解释分析,能够将连续时间内影响因素数据进行有效关联融合,揭示多影响因素之间的动态耦合关系,提高产量预测的准确率,为技术人员提供可靠的数据参考和科学指导,进而提高小麦产量。
-
公开(公告)号:CN117079712B
公开(公告)日:2024-02-20
申请号:CN202311109387.X
申请日:2023-08-30
Applicant: 中国农业科学院农业信息研究所
Abstract: 本发明涉及通路基因簇挖掘技术领域,公开了一种通路基因簇的挖掘方法、装置、设备及介质,包括:选取实体类及对应的数据属性和对象属性来构建性状调控基因本体模型;构建性状调控基因本体模型中各类实体之间的三元组来生成性状调控基因知识图谱;构建蛋白互作预测模型;基于性状调控基因知识图谱获取待挖掘蛋白的互作蛋白连通子图,并根据蛋白互作预测模型的互作关系预测对其进行补充,从而挖掘出互作蛋白完全子图;基于互作蛋白完全子图挖掘蛋白和对应基因之间的共连实体节点来获得基因结构图,并通过物理位置判断来获得通路基因簇。本发明能够增强互作蛋白预测的准确率,并成功进行通路基因簇的挖掘。
-
-
公开(公告)号:CN111737471B
公开(公告)日:2023-10-13
申请号:CN202010600107.5
申请日:2020-06-28
Applicant: 中国农业科学院农业信息研究所
IPC: G06F16/35 , G06F40/279 , G06F40/30 , G06N5/04
Abstract: 本发明公开了一种基于知识图谱的档案管理模型构建方法及系统,方法包括:获取计算机可读格式的档案文本,识别档案文本中最小的知识单元,基于各个最小的知识单元的相关关系,形成各知识单元间的语义联系;基于各知识单元间的语义联系,通过知识图谱建立动态档案多维度关联模型;根据动态档案多维度关联模型,通过编辑工具、建模语言建立计算机可识别的档案知识图谱语义模型,利用档案知识对齐、知识消歧对档案自身知识进行知识融合,并与档案知识组织模型互相映射,通过知识推理过程对语义关联进行知识更新与替代。本发明提出了通过识别最小的知识单元识别、建立多维度关联模型及知识融合技术,提高档案语义关联度与利用率。
-
公开(公告)号:CN111753099A
公开(公告)日:2020-10-09
申请号:CN202010599169.9
申请日:2020-06-28
Applicant: 中国农业科学院农业信息研究所
IPC: G06F16/36 , G06F16/31 , G06F16/335 , G06F16/35 , G06F16/28 , G06F40/289 , G06F40/30
Abstract: 本发明公开了一种基于知识图谱增强档案实体关联度的方法及系统,方法包括:获取档案文本类数据;利用实体识别模型识别档案文本类数据,生成已定义实体的实例数据;利用关系抽取模型识别已定义实体的实例数据,生成知识图谱中最小的单元;利用知识融合模型对知识图谱中最小的单元进行去重预处理,建立分区索引分文档,依据文本相似性或者结构相似度来查找匹配的实体,利用预设实体对齐算法进行知识融合,增强档案实体的关联度。本发明提出了使用实体识别、关系抽取、融合技术实现档案智能化采集与归档、数据加工与解析以及档案资源语义增强主要功能,为档案管理语义关联化、智能化发展提供有力支撑,提高档案数据关联度与利用率。
-
-
-
-
-
-
-