-
公开(公告)号:CN119313059A
公开(公告)日:2025-01-14
申请号:CN202411329617.8
申请日:2024-09-23
Applicant: 桂林电子科技大学
IPC: G06Q10/0631 , G06Q10/087 , G06F18/2431 , G06F18/22 , G06K17/00
Abstract: 本申请公开一种基于稀疏表示的港口货物实时监测智能场景适应方法,包括以下步骤:在货箱外部布置无线信号发射器和接收器,信号发射器向货箱发射特定频率的无线信号,信号接收器则接收经过货物后传输出的信号,获得不同类别货物对无线电波的遮挡作用的量化数据与货物类别的标签,通过分析接收到的信号特征,利用稀疏表示技术与预先建立的货物类别信号字典进行匹配,以准确识别货物的类别。本申请创建代表不同货物类别的信号特征字典,每个货物类别在字典中对应一个特定的信号模式,系统利用接收到的信号与字典中各个信号模式进行比较,基于此确定货物的具体类别。该方法能够高效地进行货物分类,免去传统方法中人工开箱查验,降低对人工操作的依赖,并且具有较高的识别精度和可靠性,特别适用于需要自动识别和分类大量货物的物流和运输行业。
-
公开(公告)号:CN114913466B
公开(公告)日:2024-11-08
申请号:CN202210616931.9
申请日:2022-06-01
Applicant: 桂林电子科技大学
Abstract: 本发明涉及一种基于双流信息与稀疏表示的视频关键帧提取方法,包括:拆分待提取的视频文件,获得图像帧,基于图像帧,分别构建视频空间流矩阵与视频时间流矩阵;通过视频空间流矩阵与视频时间流矩阵,得到双流信息矩阵,对双流信息矩阵进行特征提取,得到双流特征矩阵;将双流特征矩阵输入到稀疏表示模型中,计算稀疏系数矩阵,基于稀疏系数矩阵,获取关键帧索引;通过关键帧索引提取所述待提取视频文件中的关键帧。本发明可以高效提取一个视频中较少的关键帧,使提取的关键帧数量减少,降低关键帧提取的压缩率,同时提高关键帧提取算法的计算速度。
-
公开(公告)号:CN114973099B
公开(公告)日:2024-10-29
申请号:CN202210685950.7
申请日:2022-06-16
Applicant: 桂林电子科技大学
IPC: G06V20/40 , G06T7/73 , G06V10/82 , G06N3/0464
Abstract: 本发明提供了一种基于可回溯目标识别的智能寻物方法及系统,包括:对场景视频进行稀疏模型建模处理,获得稀疏模型的视频信号;对所述视频信号采用YOLO目标识别算法,并基于所述稀疏模型构造自适应目标字典,识别所述视频信号中的目标;提取所述视频信号的视频关键帧,对所述视频关键帧进行预处理,获取所述目标最后出现的位置。本发明通过基于稀疏模型的实时目标识别技术在实现目标识别的同时提高了信号处理性能以达到实时计算;通过自适应目标特征字典构造技术对多场景目标复杂的问题有良好表现。
-
公开(公告)号:CN114360042B
公开(公告)日:2024-10-29
申请号:CN202210016006.2
申请日:2022-01-07
Applicant: 桂林电子科技大学
IPC: G06V40/18 , G06N3/0464 , G06N3/08 , G06V10/44 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种人眼注视方向预测方法及系统,包括:获取待测的人眼图片及标定人眼图片;将待测的所述人眼图片与所述标定人眼图片同时输入预先训练的视线预测模型,输出待测的人眼图片中的人眼的注视方向。本发明通过设计差分支路从而缓解了个性化问题,同时提高了对标定图片的标签信息的利用程度。本发明通过残差结构优化描述待预测人眼图片的特征向量,在优化同时,也降低无效图片所造成的误差。
-
公开(公告)号:CN117689940A
公开(公告)日:2024-03-12
申请号:CN202311690885.8
申请日:2023-12-11
Applicant: 桂林电子科技大学
IPC: G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0499
Abstract: 本发明公开了一种基于ViT融合LPOM优化方法的多模态图像分类方法,包括:将待分类图像输入ViT模型后,基于Transformer结构提取所述待分类图像的图像特征;基于文本嵌入层提取所述待分类图像的文本特征;将所述图像特征和所述文本特征进行融合得到图像多模态特征;基于LPOM优化后的编码器对所述图像多模态特征进行迭代处理,输出图像分类预测结果。本发明通过引用LPOM来优化ViT模型,能够提高ViT模型的泛化能力,进而提升整体模型的的鲁棒性和泛化能力,提升模型对图片分类的准确率。
-
公开(公告)号:CN117422703A
公开(公告)日:2024-01-19
申请号:CN202311542530.4
申请日:2023-11-18
Applicant: 桂林电子科技大学
IPC: G06T7/00 , G06N3/0464 , G06T7/73 , G06V10/764 , G06V10/82
Abstract: 本发明属于热轧带钢缺陷检测领域,提供了一种基于去噪扩散隐式模型的热轧带钢缺陷检测方法,包括如下步骤:S1,获取钢材缺陷数据集;S2,将步骤S1中获取的钢材缺陷数据集作为训练集训练去噪扩散隐式模型,并在去噪扩散隐式模型中对原有的数据进行采样,生成可用数据;S3,将步骤S2中生成的可用数据人工标注后与步骤S1中获取的钢材缺陷数据集进行混合,构成带有标注信息的数据集;本发明通过使用去噪扩散隐式模型对原有的数据进行采样并生成高质量数据,解决了现有技术中只能在小数据集上训练产生虚假高精度的模型,导致鲁棒性差的问题,提高了钢材缺陷检测的精度,减少了漏检率。
-
公开(公告)号:CN116017280A
公开(公告)日:2023-04-25
申请号:CN202211720021.1
申请日:2022-12-30
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种目标免携带设备的快速室内路径跟踪方法,其特征在于,包括如下步骤:1)部署室内定位区域获取定位数据并划分数据集;2)依据稀疏表示模型得到稀疏向量;3)依据稀疏系数向量定位并获取运动轨迹。这种方法基于稀疏编码模型,计算复杂度低、定位效率高,能实现快速精确目标定位。
-
公开(公告)号:CN115910000A
公开(公告)日:2023-04-04
申请号:CN202211184026.7
申请日:2022-09-27
Applicant: 桂林电子科技大学
IPC: G10H1/00
Abstract: 本发明提供一种音乐生成方法、装置、系统以及存储介质,属于语言处理领域,方法包括:S1:分别对各个音频文件进行预处理,得到多个处理后频谱图;S2:构建生成器和鉴别器,并导入多个随机噪声向量;S3:基于生成器,对各个随机噪声向量进行频谱图映射处理得到待鉴别频谱图;S4:基于鉴别器,分别对各个处理后频谱图以及各个待鉴别频谱图进行鉴别分析,得到第一权值以及第二权值。本发明保留了大量的特征信息,对数据特征做出了更好的泛化,能够在频域上自动生成音乐,从而得到了一种新的音乐自动生成方式。
-
公开(公告)号:CN115761858A
公开(公告)日:2023-03-07
申请号:CN202211509716.5
申请日:2022-11-29
Applicant: 桂林电子科技大学
Abstract: 本申请公开了一种基于人脸外观的注视方向预测方法及系统,方法包括:采集待预测对象的人脸图片,得到原始预测图像;基于所述原始预测图像,裁剪出左眼和右眼的图片,得到人眼预测图像;构建注视方向预测模型;所述人眼预测图像输入至所述注视方向预测模型中,得到人脸注视方向。通过设计自注意力静态模块去融合粗粒度人脸特征和细粒度人眼特征,提高了不同粒度特征的融合程度;通过设计差分动态模块去显式获得动态特征,增强了对原有数据集的动态特征的利用程度。
-
公开(公告)号:CN114973099A
公开(公告)日:2022-08-30
申请号:CN202210685950.7
申请日:2022-06-16
Applicant: 桂林电子科技大学
Abstract: 本发明提供了一种基于可回溯目标识别的智能寻物方法及系统,包括:对场景视频进行稀疏模型建模处理,获得稀疏模型的视频信号;对所述视频信号采用YOLO目标识别算法,并基于所述稀疏模型构造自适应目标字典,识别所述视频信号中的目标;提取所述视频信号的视频关键帧,对所述视频关键帧进行预处理,获取所述目标最后出现的位置。本发明通过基于稀疏模型的实时目标识别技术在实现目标识别的同时提高了信号处理性能以达到实时计算;通过自适应目标特征字典构造技术对多场景目标复杂的问题有良好表现。
-
-
-
-
-
-
-
-
-