-
公开(公告)号:CN115331134B
公开(公告)日:2025-05-16
申请号:CN202210786124.1
申请日:2022-07-04
Applicant: 西北大学
IPC: G06V20/40 , G06V10/762 , G06V10/764 , G06V10/774 , G06V40/16
Abstract: 本发明涉及一种金丝猴新个体识别方法,采用基于孪生网络和深度特征聚类算法,对无身份信息金丝猴图像数据按个体分类。通过三个模块分别是金丝猴面部图像预训练编码器模块,金丝猴的类别数量估计模块,以及无标签数据进行聚类模块。来解决实际中一些身份信息缺失的图像数据,无身份信息野生灵长类动物数据,最终导致无法进行身份识别的问题。进一步将识别准确率高的灵长类动物新个体补充到原有数据集中,进行数据增强,提高模型对新个体的识别能力。从实验结果可以看出,估计的类别个数与实际类别个数误差在3个以内,SS‑NIR在金丝猴新个体识别上具有很好的性能。
-
公开(公告)号:CN118366215A
公开(公告)日:2024-07-19
申请号:CN202410458801.6
申请日:2024-04-16
Applicant: 西北大学
IPC: G06V40/20 , G06V20/40 , G06V10/774 , G06V10/82
Abstract: 本发明涉及图像数据处理方法,具体涉及一种基于深度学习技术的动物行为自动测量与定量方法,用于解决现有动物行为学研究中存在无法自动测量与定量视频中动物行为的不足之处。该基于深度学习技术的动物行为自动测量与定量方法首先建立并标注数据集,再利用数据集分别建立对应的训练集、验证集和测试集,进一步分别建立目标检测模型、目标追踪模型、姿态估计模型、面部识别模型和行为识别模型,并将这些模型整合到一个统一的框架中;利用上述模型分析并生成每个目标的活动节律图和时间分配图。
-
公开(公告)号:CN114677704B
公开(公告)日:2024-03-26
申请号:CN202210166930.9
申请日:2022-02-23
Applicant: 西北大学
IPC: G06V40/10 , G06V40/20 , G06V10/44 , G06V10/764 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于三维卷积的时空特征多层次融合的行为识别方法,该方法针对行为识别任务中视频能够提供更加丰富特征信息,采用三维卷积核以及时间和空间双流框架作为网络主干,其中一个分支提取视频时间特征,另外一个分支提取视频的空间特征。在不同的行为中,考虑到视频中的行为小目标在识别网络中的高层网络部分容易特征丢失,快节奏的行为不容易被网络感受,提出了将不同感受野上的时间和空间区域的特征均考虑进网络。以多层特征融合模块来均衡空间特征和时间特征对于最后行为分类结果的影响,充分利用提取到的多层次特征。该方法提取视频中的时间和空间特征,并对其进行融合和行为识别,相较于现有相关行为识别方法,具有更高的准确性。
-
公开(公告)号:CN116363555A
公开(公告)日:2023-06-30
申请号:CN202310239350.2
申请日:2023-03-14
Applicant: 西北大学
IPC: G06V20/40 , G06V40/20 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本申请涉及一种基于Transformer的语义信息增强的行为识别方法,本申请采样光流法和聚类方法提取视频关键帧作为输入,并利用卷积神经网络提取低水平信息;然后利用空洞卷积捕获相邻键向量之间的局部信息,进一步利用局部信息来触发挖掘全局信息的自注意力,最后将局部和全局的上下文信息进行融合;相比较于传统的自注意力机制,该方法能同时学习位置方面的局部特征和基于内容的全局交互,从而增强了视觉表示能力;此外,本申请在保证计算成本的前提下,有效提高了行为识别的准确率。
-
公开(公告)号:CN111062290B
公开(公告)日:2023-04-07
申请号:CN201911257349.2
申请日:2019-12-10
Applicant: 西北大学
IPC: G06V30/226 , G06V30/19 , G06V10/82 , G06F40/151 , G06N3/0464 , G06N3/0475 , G06N3/094 , G06N3/045
Abstract: 本发明公开了一种基于生成对抗网络的中国书法风格转换模型构建及转换方法,使用分布变换和重新参数化来捕获高维特征,此外基于无监督学习,使用完全卷积网络(FCN)结构的图像转换学习框架作为生成器,使用PatchGAN结构作为判别器。实验结果表明,所提出的GalscGAN能够成功地转换不同结构的中国书法数据,且在生成能力方面优于比较模型。
-
公开(公告)号:CN115331134A
公开(公告)日:2022-11-11
申请号:CN202210786124.1
申请日:2022-07-04
Applicant: 西北大学
IPC: G06V20/40 , G06V10/762 , G06V10/764 , G06V10/774 , G06V40/16
Abstract: 本发明涉及一种金丝猴新个体识别方法,采用基于孪生网络和深度特征聚类算法,对无身份信息金丝猴图像数据按个体分类。通过三个模块分别是金丝猴面部图像预训练编码器模块,金丝猴的类别数量估计模块,以及无标签数据进行聚类模块。来解决实际中一些身份信息缺失的图像数据,无身份信息野生灵长类动物数据,最终导致无法进行身份识别的问题。进一步将识别准确率高的灵长类动物新个体补充到原有数据集中,进行数据增强,提高模型对新个体的识别能力。从实验结果可以看出,估计的类别个数与实际类别个数误差在3个以内,SS‑NIR在金丝猴新个体识别上具有很好的性能。
-
公开(公告)号:CN115131235A
公开(公告)日:2022-09-30
申请号:CN202210692027.6
申请日:2022-06-17
Applicant: 西北大学
Abstract: 本发明公开了一种中国碑文图像去噪模型构建方法、去噪方法及装置,模型构建方法包括:采集多幅完整的带噪声的碑文图像获得噪声数据集;对噪声数据集进行预处理;将文字检测数据集中的预处理后的噪声图像作为输入,将对应的框选后的噪声图像作为参考输出,训练图像文字检测模型,得到训练好的图像文字检测模型;框外去噪;训练框内去噪模型得到训练好的框内去噪模型,最终得到中国碑文图像去噪模型。本发明不仅能够对中国碑文图像的斑点噪声进行有效去除,还能够有效去除现有噪声去除模型无法去除的划痕噪声和片状腐蚀类噪声,对各种造成进行了无差别去除,降低了复杂噪声对模型的干扰,从而实现模型去除碑文图像噪声的高效性。
-
公开(公告)号:CN114842247A
公开(公告)日:2022-08-02
申请号:CN202210412198.9
申请日:2022-04-19
Applicant: 西北大学
IPC: G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于特征累加的图卷积网络半监督节点分类方法,该方法利用图卷积和K阶邻近性来获得更大的感受野,以获取更高层次邻域的节点特征,而后将不同邻域获得的节点信息进行融合,保全节点特征信息,具体包括:提出一个由不同层次图卷积网络组成的模型,每个层次提供不同的传播效率,第K个层次包含图上随机游走的第K步的节点特征信息;根据概率转移矩阵定义高次邻接矩阵,作为不同阶层的邻接矩阵来聚合不同邻域的节点特征信息,将不同步长的节点分别进行卷积操作,得到卷积后新的输出表示;将不同邻域范围的节点卷积后得到的新的特征表示利用融合函数进行混合,得到混合邻域的特征表示,利用分类器进行分类,得到最终的输出。
-
公开(公告)号:CN114554084A
公开(公告)日:2022-05-27
申请号:CN202210101402.5
申请日:2022-01-27
Applicant: 西北大学
IPC: H04N5/232 , H04R1/10 , G05B19/042
Abstract: 本发明公开了一种基于STM32单片机的多设备协同拍照系统,包括CH340在线下载的最小系统模块、单片机模块、USB串口模块、按键输入模块和手机设备,所述CH340在线下载的最小系统模块与单片机连接,所述的单片机设置有48个引脚,通过引脚与分别与按键输入模块和USB串口模块连接,USB串口模块通过USB耳机线和按键输入模块相连,按键输入模块与手机设备连接;其中,所述按键输入模块为单片机传输拍摄信号,单片机模块接收按键输入模块的输入信号改变电压,控制引脚电压跳变,使所述的USB串口模块电压跳变,实现手机设备的拍照功能。该系统能够实现使不同设备同时进行拍照的能力。
-
公开(公告)号:CN114547235A
公开(公告)日:2022-05-27
申请号:CN202210060418.6
申请日:2022-01-19
Applicant: 西北大学
IPC: G06F16/33 , G06F40/211 , G06F40/216 , G06F40/289 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明涉及基于先验知识图的图像文本匹配模型的构建方法,构建的模型包括先验知识图模块、图像文本匹配模块和整合模块;先验知识图模块和图像文本匹配模块分别与整合模块相连接。采用构建外部先验知识图来指导图像文本匹配,极大增强模型对真实场景的理解能力,利用图卷积来构建先验知识图之间的关系,取代使用交叉注意力机制成对的计算所有图像区域和文本片段之间的局部注意力关系,减少了计算量和参数量,提高了模型的训练速度和推理速度;使用自注意力机制transformer来聚合图像区域间的注意力关系;使用预训练模型BERT提取文本特征向量,再利用注意力机制来聚合文本向量中词与词之间的注意力关系;有效提高了图像文本匹配的准确率。
-
-
-
-
-
-
-
-
-