-
公开(公告)号:CN109885653B
公开(公告)日:2022-10-04
申请号:CN201910094487.7
申请日:2019-01-30
Applicant: 南京邮电大学
IPC: G06F16/33 , G06F40/284 , G06F40/30
Abstract: 本发明提供一种文本检索方法,方法包括:初始化文本数据库集合和模糊语义关联矩阵;当确定第一层相似度数值大于预设的阈值时,将文本集合中的对应文本删除并插入第一文本集合,并将第一层相似度数值作为对应文本的相似度数值插入第一相似度集合;当确定第二层相似度数值大于阈值时,将相应文本删插入第二文本集合,并将第二层相似度数值插入第二相似度集合;当确定第三层相似度数值大于阈值时,将该文本删除并插入第三文本集合,并将第三层相似度数值作为该文本的相似度数值插入第三相似度集合;将第零、第一、第二和第三文本集合中文本作为检索结果集合进行输出。上述的方案,可以在文本检索时降低计算复杂度,节约计算资源。
-
公开(公告)号:CN113064959B
公开(公告)日:2022-09-23
申请号:CN202010001846.2
申请日:2020-01-02
Applicant: 南京邮电大学
IPC: G06F16/31 , G06F16/953 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明提出了一种基于深度自监督排序哈希的跨模态检索方法。包括以下步骤:首先学习一个标签网络用来保留语义特征与其对应的哈希码之间的相似关系。该标签网络可以有效地利用多标签信息来桥接不同模态之间的语义相关性。然后分别对图像和文本设计一个端到端的特征学习网络,进行特征学习。一方面,可以保持标签网络和图像文本网络之间的语义相关性。另一方面,可以使学习到的特征与特定的跨模态检索任务完美兼容。为了解决使用二进制分区函数编码对分区阈值十分敏感的问题,采用基于排序的编码函数。每个维度的相对排序不变,哈希编码的值就不变,这使得哈希函数不会对某些阈值非常敏感,进而获取的哈希编码鲁棒性更好。
-
公开(公告)号:CN113064959A
公开(公告)日:2021-07-02
申请号:CN202010001846.2
申请日:2020-01-02
Applicant: 南京邮电大学
IPC: G06F16/31 , G06F16/953 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明提出了一种基于深度自监督排序哈希的跨模态检索方法。包括以下步骤:首先学习一个标签网络用来保留语义特征与其对应的哈希码之间的相似关系。该标签网络可以有效地利用多标签信息来桥接不同模态之间的语义相关性。然后分别对图像和文本设计一个端到端的特征学习网络,进行特征学习。一方面,可以保持标签网络和图像文本网络之间的语义相关性。另一方面,可以使学习到的特征与特定的跨模态检索任务完美兼容。为了解决使用二进制分区函数编码对分区阈值十分敏感的问题,采用基于排序的编码函数。每个维度的相对排序不变,哈希编码的值就不变,这使得哈希函数不会对某些阈值非常敏感,进而获取的哈希编码鲁棒性更好。
-
公开(公告)号:CN109885653A
公开(公告)日:2019-06-14
申请号:CN201910094487.7
申请日:2019-01-30
Applicant: 南京邮电大学
Abstract: 本发明提供一种文本检索方法,方法包括:初始化文本数据库集合和模糊语义关联矩阵;当确定第一层相似度数值大于预设的阈值时,将文本集合中的对应文本删除并插入第一文本集合,并将第一层相似度数值作为对应文本的相似度数值插入第一相似度集合;当确定第二层相似度数值大于阈值时,将相应文本删插入第二文本集合,并将第二层相似度数值插入第二相似度集合;当确定第三层相似度数值大于阈值时,将该文本删除并插入第三文本集合,并将第三层相似度数值作为该文本的相似度数值插入第三相似度集合;将第零、第一、第二和第三文本集合中文本作为检索结果集合进行输出。上述的方案,可以在文本检索时降低计算复杂度,节约计算资源。
-
-
公开(公告)号:CN109710512A
公开(公告)日:2019-05-03
申请号:CN201811485235.9
申请日:2018-12-06
Applicant: 南京邮电大学
Abstract: 本发明揭示了一种基于测地线流核的神经网络软件缺陷预测方法,包括如下步骤:S1、将数据集降维到对应的子空间中,并确定最优的子空间维度;S2、利用数据集降维得到的特征表示构建测地线流;S3、计算测地线流核,根据测地线流核计算得到源数据和目标数据的变换矩阵及特征空间;S4、根据得到的特征空间对神经网络分类器进行训练,最终得到预测结果。本发明将迁移学习中的测地线流核和神经网络分类器相结合,通过将源数据和目标数据投影到具有相同分布的子空间中的方式,解决了不同数据集上的数据分布不同以及数据量大时计算效率低下的问题,进而实现了跨项目的软件缺陷预测。
-
公开(公告)号:CN111460201B
公开(公告)日:2022-09-23
申请号:CN202010143786.8
申请日:2020-03-04
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于生成性对抗网络的模态一致性跨模态检索方法,包括以下步骤:首先利用生成性对抗网络强大的数据分布建模能力,将文本特征映射到图像特征空间,用这种方法将跨模态检索问题转换为单模态检索问题,尽可能多地保留图像语义信息的同时减小模态的异质性。其次,设计了一个模态一致性哈希网络,将真实的图像特征和通过生成性对抗网络生成的特征投影到汉明空间中,并且利用标签信息对模态间和模态内的相似性进行建模,使得输出的哈希码在模态间和模态内具有更好的语义区分性,获得更具判别性的哈希码。最后在两个常用的基准数据集上的实验结果表明本方法与现有的流行方法相比具有更好的跨模态检索性能。
-
公开(公告)号:CN109766455B
公开(公告)日:2021-09-24
申请号:CN201811358982.6
申请日:2018-11-15
Applicant: 南京邮电大学
Abstract: 本发明公开了一种有鉴别的全相似性保留哈希跨模态检索方法,包括:由图像文本对组成样本构成数据集,并将数据集按照分成特征向量训练集和测试集后做规整和均一化处理;提取双模态数据,构造有鉴别的全相似性保留哈希的目标函数;迭代法求解目标函数,比较求解值与设定阈值的大小;使用预设公式计算哈希码;利用图像特征投影矩阵和文本特征投影矩阵对训练集进行投影变换,获得图像文本语义特征矩阵,再次计算哈希码;计算测试集中每个图像哈希码与训练集中所有文本哈希码之间的汉明距离和测试集每个文本哈希码与训练集中所有图像哈希码之间的汉明距离升序排序和并对计算结果进行精度计算,完成跨模态检索;本发明提升了跨模态检索的精度。
-
公开(公告)号:CN111460201A
公开(公告)日:2020-07-28
申请号:CN202010143786.8
申请日:2020-03-04
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于生成性对抗网络的模态一致性跨模态检索方法,包括以下步骤:首先利用生成性对抗网络强大的数据分布建模能力,将文本特征映射到图像特征空间,用这种方法将跨模态检索问题转换为单模态检索问题,尽可能多地保留图像语义信息的同时减小模态的异质性。其次,设计了一个模态一致性哈希网络,将真实的图像特征和通过生成性对抗网络生成的特征投影到汉明空间中,并且利用标签信息对模态间和模态内的相似性进行建模,使得输出的哈希码在模态间和模态内具有更好的语义区分性,获得更具判别性的哈希码。最后在两个常用的基准数据集上的实验结果表明本方法与现有的流行方法相比具有更好的跨模态检索性能。
-
公开(公告)号:CN109766455A
公开(公告)日:2019-05-17
申请号:CN201811358982.6
申请日:2018-11-15
Applicant: 南京邮电大学
Abstract: 本发明公开了一种有鉴别的全相似性保留哈希跨模态检索方法,包括:由图像文本对组成样本构成数据集,并将数据集按照分成特征向量训练集和测试集后做规整和均一化处理;提取双模态数据,构造有鉴别的全相似性保留哈希的目标函数;迭代法求解目标函数,比较求解值与设定阈值的大小;使用预设公式计算哈希码;利用图像特征投影矩阵和文本特征投影矩阵对训练集进行投影变换,获得图像文本语义特征矩阵,再次计算哈希码;计算测试集中每个图像哈希码与训练集中所有文本哈希码之间的汉明距离 和测试集每个文本哈希码与训练集中所有图像哈希码之间的汉明距离 升序排序 和 并对计算结果进行精度计算,完成跨模态检索;本发明提升了跨模态检索的精度。
-
-
-
-
-
-
-
-
-