-
公开(公告)号:CN119314194A
公开(公告)日:2025-01-14
申请号:CN202411544045.5
申请日:2024-10-31
Applicant: 西安建筑科技大学
IPC: G06V30/413 , G06V30/42 , G06V30/146 , G06V30/148 , G06V30/19 , G06V10/766 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于YOLOv8‑Seg的增值税发票图像内容分割方法及系统,引入小目标检测层使模型能够更精准地捕捉和定位发票中的小目标,有效提升对复杂发票的识别和检测能力。引入了C2f_DCN模块,融合可变形卷积,增强模型对图像中不同尺寸和形态目标的感知能力,能够更好地适应图像中的各种变化。引入了全局注意力GAM模块,加强模型的特征提取能力,引入SIoU损失作为边界框损失函数,解决CIoU计算中存在的准确性不高的问题,提升模型对目标定位的精度和稳定性。通过优化后续流程,实现了对发票文本对象的精确裁剪与识别,最后基于文字识别开源框架构建文字识别模型为处理和分析发票提供了准确且可靠的数据基础。
-
公开(公告)号:CN118447168A
公开(公告)日:2024-08-06
申请号:CN202410626030.7
申请日:2024-05-20
Applicant: 西安建筑科技大学
Abstract: 本发明公开了一种可扩展的大场景三维重建方法、装置、设备及存储介质,使用NeRF模型中增设的全局网络对不同场景的多视角图像以及对应的位姿信息进行全局捕获,得到大场景的几何结构;使用NeRF模型中增设的局部网络对不同场景的多视角图像以及对应的位姿信息进行局部捕获,得到大场景中不同场景的的体密度;利用外观嵌入网络对大场景中不同场景的多视角图像进行外观特征提取,得到大场景中不同场景的外观特征;使用NeRF模型中增设的全局网络将大场景中不同场景的的体密度以及大场景中不同场景的外观特征转换为大场景中不同场景的局部细节特征;使用NeRF模型中增设的全局网络对大场景的几何结构以及大场景中不同场景的局部细节特征进行融合。本发明能够有效解决大场景三维重建中的计算瓶颈、场景细节丢失以及光照适应性问题。
-
公开(公告)号:CN113139089A
公开(公告)日:2021-07-20
申请号:CN202110528820.8
申请日:2021-05-14
Applicant: 西安建筑科技大学
IPC: G06F16/735 , G06F16/78
Abstract: 本发明公开了一种SDDNE模型协同过滤模型的电影推荐方法、系统、介质及设备,包括以下步骤:采集测试所需要的用户电影数据集;将数据集输入深度信念网络进行预处理,将得到的处理数据输入SDDNE模型,通过拉普拉斯特征映射和堆叠降噪自编码器联合进行特征提取,得到用户、电影特征向量;将得到的特征向量进行拼接,得到用户‑电影评分矩阵,将得到的矩阵输入协同过滤模型,得到最终的电影推荐结果。本发明通过集成学习将SDDNE模型和协同过滤模型有效的结合在一起,从而可以极大的提高对用户喜欢的电影推荐准确度和稳定性。
-
公开(公告)号:CN118691809A
公开(公告)日:2024-09-24
申请号:CN202410656226.0
申请日:2024-05-24
Applicant: 西安建筑科技大学
IPC: G06V10/26 , G06V20/10 , G06V10/82 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于注意力调控的遥感图像城市水域分割方法及相关装置,利用遥感图像城市水域分割模型对遥感图像进行处理,得到分割结果;遥感图像城市水域分割模型为采用包含城市水域的遥感图像样本训练改进的Segformer模型得到,改进的Segformer模型包括MiT编码器和解码器,MiT编码器用于提取遥感图像的特征图;解码器在上采样操作后增设门控注意力机制模块,门控注意力机制模块的输入为解码器的深层特征图和编码器的浅层特征图,解码器在MLP层后增设极化自注意力机制模块,极化自注意力机制模块的输入为经过MLP层处理后具有相同大小的多尺度特征图;改进的Segformer模型采用混合损失函数。本发明能够解决城市水域漏分、错分和类别不均衡的问题,进而提高分割目标精度。
-
公开(公告)号:CN114818934A
公开(公告)日:2022-07-29
申请号:CN202210462631.X
申请日:2022-04-28
Applicant: 西安建筑科技大学
IPC: G06K9/62 , G06N3/12 , G06V10/762 , G06V10/764 , G06V10/75
Abstract: 本发明公开了一种基于谱聚类的BOW图匹配方法及系统,方法包括如下过程:提取引文网络图的节点特征和拓扑特征;使用谱聚类算法结合经遗传算法对K值优化得到的优化的K‑means++算法将引文网络图的节点特征和拓扑特征描述子转换为单词,实现词典的构建;使用局部约束编码的方式对所述词典进行特征编码,得到视觉词汇直方图;对视觉词汇直方图进行分类,实现基于谱聚类的BOW图匹配方法。本发明利用谱聚类算法对高维数据集进行聚类,然后在低维解空间采用K‑means算法进行二阶段聚类,解决了对高维数据处理效果不佳以及分类效果不高的问题。
-
公开(公告)号:CN113139088A
公开(公告)日:2021-07-20
申请号:CN202110528119.6
申请日:2021-05-14
Applicant: 西安建筑科技大学
IPC: G06F16/735 , G06F16/78
Abstract: IDF模型协同过滤模型的电影推荐方法、介质、设备及系统,包括以下步骤:采集电影推荐中影响因子的用户数据集;对用户数据集中相关影响因素数据通过作为深度置信网络DBN的输入,来进行数据预处理;将预处理之后的数据输入到复合多粒度扫描IDF模型中并进行训练;将得到的特征向量进行拼接,得到用户‑电影评分矩阵,将得到的矩阵输入协同过滤模型,得到最终的电影推荐结果。通过将采集的数据集进行多粒度扫描,针对电影推荐系统所处理数据结构的复杂性与电影与用户间的信息交互传递的特性,借鉴随机取样原则,保证在一定时间内,总体范围内的每个样本对象都能以确定、非零的概率被选择并作为所要研究的对象,保证了所需要选取样本的代表性。
-
公开(公告)号:CN119339239A
公开(公告)日:2025-01-21
申请号:CN202411446782.1
申请日:2024-10-16
Applicant: 西安建筑科技大学
Abstract: 本发明公开了一种基于多尺度上下文感知网络的遥感图像道路提取方法及系统,属于图像处理技术领域,该方法包括以下步骤,首先,在编码器中设计了一个具有上下文聚合模块的分支,以增强上下文信息提取,并缓解因遮挡引起的语义模糊问题。其次,为了解决编解码器之间语义信息不匹配的问题并提高模型的空间信息提取能力,在跳跃连接中引入了空间特征提取模块,取代了SwinUnet中直接复制编码器特征的方法。最后,在下采样阶段设计了一个特征收缩模块,以减少编码器中信息丢失并增强网络的分割能力。相比于已有的遥感图像道路分割方法,该发明方法通过全局建模、上下文增强和信息匹配优化,有效提升了遥感图像道路提取的精度和性能。
-
公开(公告)号:CN119251419A
公开(公告)日:2025-01-03
申请号:CN202411309653.8
申请日:2024-09-19
Applicant: 西安建筑科技大学
IPC: G06T17/05 , G06T3/4053 , G06T3/4046 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本发明提供了一种融合梯度特征Transformer的DEM超分辨率重建方法及系统,属于图像处理技术领域,所述重建方法由多个残差特征融合块组成,其内部的多尺度金字塔切分Transformer层将多头自注意力和金字塔切分注意力进行融合,更好地捕捉DEM局部和整体特征信息,其次为使重建的DEM更加接近真实,使用了双滤波卷积块,通过两个不同滤波块的并行结构,充分提取DEM高低频特征,最终在梯度域和高度域双重约束下进行超分辨率重建,本发明实现了重建DEM的细节清晰,适应不同尺度和复杂度的地形特征,解决了传统算法无法准确恢复DEM细节的问题。
-
公开(公告)号:CN113139088B
公开(公告)日:2024-08-16
申请号:CN202110528119.6
申请日:2021-05-14
Applicant: 西安建筑科技大学
IPC: G06F16/735 , G06F16/78
Abstract: IDF模型协同过滤模型的电影推荐方法、介质、设备及系统,包括以下步骤:采集电影推荐中影响因子的用户数据集;对用户数据集中相关影响因素数据通过作为深度置信网络DBN的输入,来进行数据预处理;将预处理之后的数据输入到复合多粒度扫描IDF模型中并进行训练;将得到的特征向量进行拼接,得到用户‑电影评分矩阵,将得到的矩阵输入协同过滤模型,得到最终的电影推荐结果。通过将采集的数据集进行多粒度扫描,针对电影推荐系统所处理数据结构的复杂性与电影与用户间的信息交互传递的特性,借鉴随机取样原则,保证在一定时间内,总体范围内的每个样本对象都能以确定、非零的概率被选择并作为所要研究的对象,保证了所需要选取样本的代表性。
-
公开(公告)号:CN118397456A
公开(公告)日:2024-07-26
申请号:CN202410656220.3
申请日:2024-05-24
Applicant: 西安建筑科技大学
IPC: G06V20/10 , G06V10/82 , G06N3/0455 , G06N3/08 , G06N3/0464
Abstract: 本发明公开了一种基于Segformer的轻量级遥感图像城市水域识别方法和相关装置,将所述遥感图像输入城市水域识别模型,得到识别结果;所述城市水域识别模型为采用包含城市水域的遥感图像样本训练改进的Segformer模型得到,所述改进的Segformer模型包括改进的BiFormer编码器和解码器,所述改进的BiFormer编码器中的Transformer Block层包括双重注意力特征增强模块,所述双重注意力特征增强模块由双层路由注意力机制模块和递归空洞自注意力机制模块构成,所述改进的BiFormer编码器中用于提取遥感图像的特征图;所述解码器中的上采样层采用CARAFE算子,所述解码器用于对所述特征图进行特征重构,得到识别结果。本发明能够在计算资源有限的设备上实现高效、准确的城市水域识别。
-
-
-
-
-
-
-
-
-