-
公开(公告)号:CN114898372A
公开(公告)日:2022-08-12
申请号:CN202210628050.9
申请日:2022-06-06
Applicant: 桂林电子科技大学
IPC: G06V30/148 , G06V30/18 , G06V30/19 , G06V10/82 , G06V10/764 , G06T5/30 , G06N3/04
Abstract: 本发明涉及文字检测领域,具体涉及一种基于边缘注意力引导的越南场景文字检测方法,包括:使用ResNet提取目标的特征信息,并在ResNet中利用感受野残差块RFRB产生丰富的感受野;使用多路融合特征金字塔网络MF‑FPN对特征信息进行融合,得到目标不同层次的特征信息;将特征信息输入RPN得到一定数量的候选框;将候选框和特征信息经RoI Align后输入分类分支和掩码分支预测目标的类别信息、边界框信息和掩码信息,并在分类分支中使用Re‑Score机制抑制非文字目标以及在分类分支和掩码分支使用边缘注意力机制EAM突出目标的边缘,该方法可有效检测不同尺度的越南场景文字目标,并剔除一些非文字目标。
-
公开(公告)号:CN108597539B
公开(公告)日:2021-09-03
申请号:CN201810134149.7
申请日:2018-02-09
Applicant: 桂林电子科技大学
Abstract: 本发明公开了基于参数迁移和语谱图的语音情感识别方法,包括以下步骤:1):从中科院自动化所汉语情感数据库中采集语音情感数据并对语音情感数据进行预处理,其中语音情感数据包括6种情感:生气、害怕、高兴、中性、伤心、惊奇;2):构建基于预训练卷积循环神经网络的网络模型;3):对步骤2)中的网络模型进行参数迁移并训练。这种方法可以提取语谱图时频两域的情感特征,提高识别准确率,并且还能学习到预训练的知识,提高网络训练速度。
-
公开(公告)号:CN114612906A
公开(公告)日:2022-06-10
申请号:CN202210206849.9
申请日:2022-03-04
Applicant: 桂林电子科技大学
Inventor: 文益民
IPC: G06V30/148 , G06K9/62 , G06V10/764 , G06V10/80 , G06V30/19
Abstract: 本发明涉及文字识别领域,具体涉及一种基于改进DAN的越南场景文字识别方法,包括:使用ResNet作为编码器从输入图像中提取原始特征图;将所述原始特征图输入CAM中得到注意力图,具体方式是将原始特征图输入FPN网络得到融合特征图;将融合特征图输入VSFM模块得到视觉与序列融合特征;将所述视觉与序列融合特征输入FCN网络以得到注意力图;将所述原始特征图和所述注意力图以及VSFM中间特征共同输入增强型解码器进行解码,得到场景图的识别结果,该方法有效缓解注意力漂移,将变音符号识别的更准确,并且可以有效区分相似字符,识别结果更好。
-
公开(公告)号:CN108388544A
公开(公告)日:2018-08-10
申请号:CN201810137134.6
申请日:2018-02-10
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于深度学习的图文融合微博情感分析方法,其特征在于,包括如下步骤:S1采集图文微博数据并进行预处理;S2提取图文微博文本情感特征;S3提取图文微博图片情感特征;S4进行图文融合微博情感分析。这种方法通过结合微博中的图片和文本,能更加准确地判断用户的情感倾向,能提高情感分析的准确率。
-
公开(公告)号:CN114612906B
公开(公告)日:2025-04-15
申请号:CN202210206849.9
申请日:2022-03-04
Applicant: 桂林电子科技大学
Inventor: 文益民
IPC: G06V30/148 , G06V10/764 , G06V10/80 , G06V30/19
Abstract: 本发明涉及文字识别领域,具体涉及一种基于改进DAN的越南场景文字识别方法,包括:使用ResNet作为编码器从输入图像中提取原始特征图;将所述原始特征图输入CAM中得到注意力图,具体方式是将原始特征图输入FPN网络得到融合特征图;将融合特征图输入VSFM模块得到视觉与序列融合特征;将所述视觉与序列融合特征输入FCN网络以得到注意力图;将所述原始特征图和所述注意力图以及VSFM中间特征共同输入增强型解码器进行解码,得到场景图的识别结果,该方法有效缓解注意力漂移,将变音符号识别的更准确,并且可以有效区分相似字符,识别结果更好。
-
公开(公告)号:CN108597539A
公开(公告)日:2018-09-28
申请号:CN201810134149.7
申请日:2018-02-09
Applicant: 桂林电子科技大学
Abstract: 本发明公开了基于参数迁移和语谱图的语音情感识别方法,包括以下步骤:1):从中科院自动化所汉语情感数据库中采集语音情感数据并对语音情感数据进行预处理,其中语音情感数据包括6种情感:生气、害怕、高兴、中性、伤心、惊奇;2):构建基于预训练卷积循环神经网络的网络模型;3):对步骤2)中的网络模型进行参数迁移并训练。这种方法可以提取语谱图时频两域的情感特征,提高识别准确率,并且还能学习到预训练的知识,提高网络训练速度。
-
公开(公告)号:CN108491891A
公开(公告)日:2018-09-04
申请号:CN201810301668.8
申请日:2018-04-04
Applicant: 桂林电子科技大学
Abstract: 本发明提供一种基于决策树局部相似性的多源在线迁移学习方法,包括:步骤1.在每个源领域数据上分别训练决策树,并将其存储于决策树缓存池,在目标领域数据上建立一棵仅包含一个根节点的空的目标领域决策树;步骤2.根据目标领域样本及其k个近邻样本从源领域中选取局部相似度最高的源领域决策树;步骤3.对目标领域样本进行分类;步骤4.根据分类损失分别调节源领域决策树和目标领域决策树对应的权重;步骤5.利用目标领域样本及其类别更新目标领域决策树;步骤6.返回步骤2,获取下一个目标领域样本,直到完成对目标领域中所有样本的分类。本发明用源领域与目标领域局部相似性的指标,能在源领域与目标领域相似度不高的情形下实施有效的迁移学习。
-
公开(公告)号:CN101827002B
公开(公告)日:2012-05-09
申请号:CN201010184726.7
申请日:2010-05-27
Applicant: 桂林电子科技大学
Inventor: 文益民
IPC: H04L12/26
Abstract: 本发明公开了一种数据流分类的概念漂移检测方法,其步骤为:①数据流分块:根据事先设定的数据块的规模d,按照数据到达的先后顺序每采集到d个训练样本就训练一个分类器。②滑动窗口调整:设定滑动窗口中分类器hi的数量K,当滑动窗口中分类器hi的数量少于K时,最新训练的分类器hi自动加入滑动窗口;当滑动窗口中分类器hi的数量等于K时,对滑动窗口中的分类器hi进行更新;③概念漂移检测:当需要进行概念检测时,使用可信多数投票法从滑动窗口中选择合适的分类器给出概念判别。本发明是一种原理简单、运行可靠、检测精度高、检测速度快、适用范围广的数据流分类的概念漂移检测方法。
-
公开(公告)号:CN116168252A
公开(公告)日:2023-05-26
申请号:CN202310212071.7
申请日:2023-03-07
Applicant: 桂林电子科技大学
IPC: G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/084 , G06V10/80
Abstract: 本发明公开了一种基于抽象关系场景图的图像情感识别方法,包括以下步骤:构建新的对象和属性检测器并提取图像中对象特征及其对应的属性特征;通过对象的特征推理对象间的亲密度和抽象关系特征并构建抽象关系场景图;构建图神经网络推理抽象关系场景图使各对象的特征包含情感因素;构建场景特征提取器提取图像的场景特征并设计渐进式注意力机制融合多个对象特征得到一个整体对象特征;拼接图像的场景特征和整体对象特征送入情感分类器得到图像情感类别。相较于现有技术,本发明利用对象间的关系以及对象与场景间的交互作用识别图像情感,有效缩小了低级视觉和高级情感之间的鸿沟,并提升了图像情感识别的分类准确率。
-
公开(公告)号:CN103559252A
公开(公告)日:2014-02-05
申请号:CN201310533179.2
申请日:2013-11-01
Applicant: 桂林电子科技大学
CPC classification number: G06F17/30864 , G06Q10/04
Abstract: 给游客推荐其很可能会浏览的景点的方法,首先获取游客的浏览行为,并将游客按照景点偏好的相似性聚类成若干个游客群,同时为每个游客群分别构建Markov预测模型,具体包括以下几个步骤:1)数据采集;2)数据预处理;3)景点偏好矩阵建立;4)游客聚类;5)预测模型建立;6)景点预测。将游客进行聚类后构建Markov预测模型的算法比现有方法正确率高,实验效果好,预测效果好。
-
-
-
-
-
-
-
-
-