-
公开(公告)号:CN119149772A
公开(公告)日:2024-12-17
申请号:CN202411176128.3
申请日:2024-08-26
Applicant: 西南财经大学
IPC: G06F16/73 , G06F18/214 , G06F18/22 , G06F18/23 , G06F16/75 , G06F16/783
Abstract: 本发明涉及信息检索领域,其公开了一种文本视频对相似性评估模型构建方法,首先,输入正样本对并构建其负样本对;然后,通过视觉编码器,获得样本对的视觉特征,通过文本编码器,获得样本对的文本特征;之后,分别计算样本对的粗、中、细粒度相似性;其中,粗粒度相似性,是对视频与文本,进行整体的相似性计算;中粒度相似性,是对视频所包含图像帧与文本,进行帧级的相似性计算;细粒度相似性,是对视频所包含视觉实体与文本所包含单词,进行因子级的相似性计算。在检索时,能引入更多的特征,从多个粒度对文本和视频的相似性进行比较,能够降低文本与视觉在语义上的不对等所导致的影响,并显著提升了检索性能。
-
公开(公告)号:CN115017924B
公开(公告)日:2023-11-07
申请号:CN202210808791.5
申请日:2022-07-11
Applicant: 西南财经大学 , 喀什地区电子信息产业技术研究院
IPC: G06F40/58 , G06F40/279 , G06F40/30 , G06F40/126 , G06N3/0499 , G06N3/08
Abstract: 本发明涉及属于机器翻译领域,提供了跨语际语言翻译的神经机器翻译模型构建及其翻译方法,适用于各类跨语际语言翻译。在训练时,基于训练子集的源语言语料进行编码,构建融合其上下文依赖关系的文本向量,然后计算得其文本表征;然后,针对该子集逐词进行解码,在每一步,首先融合历次译文文本和源文本获得混合表征,然后基于此进行焦点位置计算,获取当前焦点位置的翻译候选词;通过不同子集,在达到一定的步数后,根据候选词和真值的误差进行迭代训练。翻译方法,同样逐词进行翻译,在每一个翻译步,生成当前步基于焦点位置的翻译候选表示,并利用启发式搜索算法,选择其中全局概率值最大的候选文本作为当前步输出的译文文本,直至翻译完成。
-
公开(公告)号:CN115170418A
公开(公告)日:2022-10-11
申请号:CN202210783254.X
申请日:2022-07-05
Applicant: 西南财经大学 , 喀什地区电子信息产业技术研究院
Abstract: 本发明涉及属于计算机视觉领域。本发明提供符合退化的低秩高维图像填充模型构建方法,首先,选择训练数据,构建训练集;其次,选择预训练好的深度填充网络作为待构建模型的隐式正则项;然后,构建模型,创建辅助变量与拉格朗日乘子,得到模型的增广拉格朗日函数,将模型求解分割为不同的子问题后再迭代求解;利用训练集对模型进行训练,确定超参数,所述超参数至少包括模型最大迭代次数、模型收敛阈值、模型权衡参数;直至预测性能达到预设值后停止训练,则符合退化的低秩高维图像填充模型构建完成。本发明将张量完备化的退化过程构建为线性退化算子,引入到模型求解过程中,使模型可以有效利用到张量的退化信息。
-
公开(公告)号:CN113658110A
公开(公告)日:2021-11-16
申请号:CN202110832315.2
申请日:2021-07-22
Applicant: 西南财经大学
Abstract: 本发明公开了一种基于动态领域自适应学习的医学图像识别方法,涉及迁移学习技术领域,其解决了近红外脑成像中有标签数据获取成本高昂的难题。本发明包括以下步骤:基于ImageNet数据集进行预处理,得到源域数据集,同时使用近红外脑成像仪采集少量的脑部医学图像数据,得到目标域数据集;基于源域数据集定义用于图像识别的卷积神经网络模型,利用反向传播算法对卷积神经网络进行训练,更新参数,直至网络收敛,完成训练;将目标域数据集代入训练好的卷积神经网络中,获取脑部医学图像数据的识别输出结果,进行测试。本发明实现了动态自动寻找进行迁移学习的最佳时机的功能,显著提高了网络的分类精度和收敛速。
-
公开(公告)号:CN113658108A
公开(公告)日:2021-11-16
申请号:CN202110830971.9
申请日:2021-07-22
Applicant: 西南财经大学 , 电子科技大学中山学院
Abstract: 本发明公开了一种基于深度学习的玻璃缺陷检测方法,本发明属于人工智能技术领域,具体的是涉及深度学习的图像识别技术。本发明包括定义了对普通的高拍摄像头所拍摄的原始玻璃图片的预处理;基于生成式对抗网络中的pix2pix网络对预处理后的玻璃图片进行玻璃边缘的提取;基于局部和全局融合特征的玻璃缺陷多尺度分类器对所提取到的玻璃边缘图片进行缺陷检测,输出为玻璃有无缺陷的分类结果。本发明在玻璃缺陷检测的效率上明显优于传统的人工肉眼分辨方式,一定程度上减少了玻璃制造过程中的人工开销,并且保证了玻璃缺陷检测模型的较高的检测率和较低的误检率。
-
公开(公告)号:CN113657176A
公开(公告)日:2021-11-16
申请号:CN202110832335.X
申请日:2021-07-22
Applicant: 西南财经大学 , 电子科技大学中山学院
Abstract: 本发明公开了一种基于主动对比学习的行人重识别实现方法,涉及人工智能中的计算机视觉领域。本发明包括主动学习模块,对比学习模块。首先通过一个基于损失预测的主动学习模块来挑选高价值样本,设置主动学习每次选取的数量为Bt,再经由人工进行标记,得到行人标记ID。然后将标记好的样本送入对比学习模块,拥有相同标记ID的样本定义为正样本,不一致标记ID的样本定义为负样本,再优化对比损失,使得相同ID的行人样本特征分布更为接近,距离更小;不同ID的样本特征分布更远,距离更大。
-
公开(公告)号:CN119360181A
公开(公告)日:2025-01-24
申请号:CN202411416247.1
申请日:2024-10-11
IPC: G06V10/82 , G06V10/764 , G06V10/776 , G06N3/096 , G06N3/094 , G06N3/084 , G06N3/045 , G06N3/0475
Abstract: 本发明涉及计算机视觉的对抗攻防领域,具体涉及一种即插即用的选择性模块对抗鲁棒微调方法,通过引入模块的泛化敏感度指数和鲁棒关键性指数,并基于初始模型所包含各层网络模块的鲁棒关键性指数和泛化敏感度指数,以最大化鲁棒关键性指数和最小化泛化敏感度指数为目标,确定实施微调的网络模块;最终,通过冻结其余所有模块参数,利用微调样本集,对实施微调的网络模块的参数实施微调,获得鲁棒增强的图像分类模型,能全面考虑模型鲁棒与泛化之间的关系,精确识别最关键的模块进行微调,在保持甚至略微提高泛化的情况下大幅增强模型鲁棒性,并具备即插即用的特性,可作为通用组件部署于各种对抗训练中,能对鲁棒模型进行二次鲁棒增强。
-
-
公开(公告)号:CN110135510B
公开(公告)日:2023-08-01
申请号:CN201910427865.9
申请日:2019-05-22
Applicant: 电子科技大学中山学院 , 西南财经大学
IPC: G06V10/778 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种动态领域自适应方法、设备及计算机可读存储介质,包括以下步骤:基于原始图像数据获取源域数据集和目标域数据集;基于源域数据集定义用于图像识别的卷积神经网络的各层级参数,并在卷积神经网络中全连接层中的输出层之前加入自适应层;计算卷积神经网络的自适应损失LMMD;基于自适应损失LMMD修改卷积神经网络的各层级参数,得到调整后的卷积神经网络;将目标域数据集代入调整后的卷积神经网络,获取图像数据识别的输出结果。本发明还同时公开了一种动态领域自适应设备及计算机可读存储介质。
-
公开(公告)号:CN115017924A
公开(公告)日:2022-09-06
申请号:CN202210808791.5
申请日:2022-07-11
Applicant: 西南财经大学 , 喀什地区电子信息产业技术研究院
IPC: G06F40/58 , G06F40/279 , G06F40/30 , G06F40/126 , G06N3/04 , G06N3/08
Abstract: 本发明涉及属于机器翻译领域,提供了跨语际语言翻译的神经机器翻译模型构建及其翻译方法,适用于各类跨语际语言翻译。在训练时,基于训练子集的源语言语料进行编码,构建融合其上下文依赖关系的文本向量,然后计算得其文本表征;然后,针对该子集逐词进行解码,在每一步,首先融合历次译文文本和源文本获得混合表征,然后基于此进行焦点位置计算,获取当前焦点位置的翻译候选词;通过不同子集,在达到一定的步数后,根据候选词和真值的误差进行迭代训练。翻译方法,同样逐词进行翻译,在每一个翻译步,生成当前步基于焦点位置的翻译候选表示,并利用启发式搜索算法,选择其中全局概率值最大的候选文本作为当前步输出的译文文本,直至翻译完成。
-
-
-
-
-
-
-
-
-