-
公开(公告)号:CN111968700A
公开(公告)日:2020-11-20
申请号:CN202010644955.6
申请日:2020-07-07
Applicant: 南京农业大学
Abstract: 本发明公开了一种基于BERT的水稻表型组学知识图谱关系提取方法及系统,包括如下步骤:首先,使用植物本体论对于水稻表型组学数据进行关系分类,获得关系数据集;其次,将关系数据集转化为词向量、位置向量以及句子向量表示,输入BERT模型进行训练与测试,生成关系抽取模型;最后,将需要抽取的水稻表型组学文本与实体输入关系抽取模型,返回相应的关系,本发明构建了水稻表型组学专用数据集,使用多种向量表示作为输入,能够更好对句子内部以及句间关系特征进行提取,提升水稻表型组学知识图谱关系提取的效率和性能。
-
公开(公告)号:CN110175642A
公开(公告)日:2019-08-27
申请号:CN201910432558.X
申请日:2019-05-22
Applicant: 南京农业大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于PCA降维和特征二元化的菊花相似性计算方法,该方法首先对菊花数据预处理和BOW(Bag-of-words)建模,包括将大规模样本数据集中的图像转为灰度图像,提取所有图像的SIFT特征描述向量和使用K-means聚类,最后引入FDF-IFDF模型,生成最终的训练样本特征向量文件;通过PCA降维处理对高维向量进行降维,把降维后的数据映射到一个二进制超立方体的顶点上并最小化量化误差,生成菊花图像的二元编码;通过哈希函数并构建位置敏感哈希索引。本发明更容易获取图像的本质特征,通过降维实现简化处理过程。
-