-
公开(公告)号:CN113628349B
公开(公告)日:2024-02-02
申请号:CN202110902735.3
申请日:2021-08-06
Applicant: 西安电子科技大学
IPC: G06T19/00 , G06V20/20 , G06V20/70 , G06V10/26 , G06V10/44 , G06V10/74 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08 , G01C21/20
Abstract: 本发明公开了一种基于场景内容自适应的AR导航方法、设备及可读存储介质,所述方法包括:步骤1,设计数个虚拟形象,将其封装为数据结构,并添加数据结构索引;步骤2,训练深度学习神经网络;步骤3,进行路径规划;步骤4,获取移动中的实景图像,对其进行分类,若分类结果为数据结构索引,则跳转至步骤5;步骤5,继续对实景图像进行目标对象位置分割与语义分析,得到语义分析结果;步骤6,确定实景地点位置,计算虚拟形象尺寸和角度;步骤7,添加虚拟形象;步骤8,重复获取实景图像,对虚拟形象进行自适应调整;本发明能自适应调整虚拟形象的尺寸、角度等信息,提高虚拟形象与用户的交互效果。
-
公开(公告)号:CN117058193A
公开(公告)日:2023-11-14
申请号:CN202310995158.6
申请日:2023-08-09
Applicant: 西安电子科技大学
IPC: G06T7/246 , G06T7/277 , G06T1/20 , G06V20/40 , G06V10/25 , G06V10/62 , G06V10/764 , G06V10/82 , G06V10/96
Abstract: 本发明公开了基于Deepsort的密集对象多目标跟踪方法,将摄像头采集到的视频帧作为模型输入;采用yolov7目标检测模型提取视频帧中目标物体的外观特征,将输入图片划分为多个大小相同的网格,同时预测当前物体的边界框和类别。保留满足指定阈值的预测边界框,并对检测产生的预测边界框进行非最大值抑制计算,去除冗余边界框后,输出目标边界框,标注目标类型和置信度分数;将检测得到的物体坐标信息和物体类别信息输入到Deepsort多目标跟踪模型中,Deepsort通过卡尔曼滤波来预测下一帧跟踪物体的坐标,使用余弦距离对比物体的外观特征,进行目标间的相似度比较,使用匈牙利算法将当前帧的检测结果与上一帧的跟踪结果进行匹配。本发明能够满足高帧率相机下实时跟踪的目标。
-
公开(公告)号:CN116386587A
公开(公告)日:2023-07-04
申请号:CN202310223774.X
申请日:2023-03-09
Applicant: 西安电子科技大学广州研究院
IPC: G10L13/02 , G10L21/0208
Abstract: 本发明公开了一种回声音频生成系统及方法,涉及语音信号处理技术领域。包括依次连接的音频输入模块、音频处理模块和音频输出模块;音频输入模块用于对原始音频进行预处理操作,输出预处理音频,并将其发送至音频处理模块;音频处理模块用于选择预处理音频的回声路径,生成回声音频并将其发送至音频输出模块;音频输出模块接收回声音频并对其进行后处理操作。本发明通过线性增益和延时处理生成线性回声,通过加噪处理生成线性带噪回声;通过多路径的设定生成多路线性回声;通过上述可控的参数设定,采集到指定的多种类型的回声。本发明无需通过硬件设备采集回声音频,节省了大量的人力物力资源;耗时短,可以满足短期内大量生成回声的需求。
-
公开(公告)号:CN115810710A
公开(公告)日:2023-03-17
申请号:CN202211591183.X
申请日:2022-12-12
Applicant: 贵州梅岭电源有限公司 , 电子科技大学
IPC: H01M4/08
Abstract: 本发明属于一次锂电池技术领域,具体涉及一种一次锂电池锂合金负极的表面修饰方法,采用三氟甲烷硫醇银修饰Li‑B合金,使Li‑B合金表面生成含金属银、LiF、硫化物的表面层。本发明方法在锂合金表面构筑了一层具有高稳定性、高锂离子电导率特性的表面层,能有效对合金中的金属锂起到保护作用,降低锂合金表面阻抗,消除电化学噪声现象,从而延长了一次锂电池的贮存寿命,提升了电化学性能。本发明方法实现过程简单、实用、高效,具有极强的应用前景。
-
公开(公告)号:CN115797498A
公开(公告)日:2023-03-14
申请号:CN202211483418.3
申请日:2022-11-24
Applicant: 西安电子科技大学
Abstract: 本发明公开了一种基于视觉概念图表示的人‑模型交互解释引导方法、电子设备和存储介质,所述方法包括:以模型为基础提取重要图像块作为类别概念,构造结构概念图,以此为工具表示任意图像,再构建特征流动透明的推理网络模拟已有分类网络,观察概念图各部分的贡献,以实现决策的可解释;另一方面,人自主将每个部件作为一个概念,对部件进行属性整理,结合部件关系构造结构部件图。基于此,人可用类别的结构部件图更新结构概念图,重新训练推理网络,再通过知识蒸馏对原网络进行知识引导。基于这一双向交互方法,本发明可通过模型提供人易理解的推理逻辑,实现神经网络的可解释;同时允许人利用先验知识向网络提供反馈,以提高网络的性能。
-
公开(公告)号:CN115761886A
公开(公告)日:2023-03-07
申请号:CN202211448907.5
申请日:2022-11-18
Applicant: 西安电子科技大学
IPC: G06V40/20 , G06V20/40 , G06V20/70 , G06V10/62 , G06V10/74 , G06V10/764 , G06V10/82 , G06F40/205 , G06F40/284 , G06N3/045 , G06N3/0442 , G06N3/0475 , G06N3/084 , G06N3/094
Abstract: 本发明公开了基于自然语言知识描述引导的可解释性行为识别方法,包括:①对RGB视频应用目标检测器和特征提取器,将检测出的实体和对应的特征组织为时序图结构;②基于时序图提取视频的时空特征,并使用可微离散值估计器对视频的时空特征进行分段;③构建与视频内容相关的描述前缀树;④将描述前缀树中节点与视频分段进行匹配,使用节点所对应的文本描述解释视频的识别过程;⑤设计特征空间鉴别器,消除时空特征与文本特征之间的域间误差。本发明对神经网络识别视频行为过程进行了解释,同时还对视频的每个分段的决策过程进行解释,避免了因识别网络易受攻击而导致在许多具有严格安全要求的现实场景中的应用限制。
-
公开(公告)号:CN115499169A
公开(公告)日:2022-12-20
申请号:CN202211008675.1
申请日:2022-08-22
Applicant: 西安电子科技大学
IPC: H04L9/40 , H04L43/045 , H04L43/0876
Abstract: 一种基于因果图的多阶段攻击过程重构方法,包括:从检测到的网络攻击事件中提取事件主体,主体类型包括IP地址、进程、文件、服务;从主机的审计日志、网络流分析日志以及进程和服务的日志信息中抽取事件主体相关的日志信息;对提取到的日志信息进行预处理,从中提取更细粒度的主体作为因果图的节点;从日志信息中提取节点间的交互及时间戳信息,作为因果图的边;根据攻击事件主体和因果图的节点之间的关系,把攻击事件涉及的因果图的节点标记为恶性节点;把因果图恶性节点涉及的边按时间戳排序,构成反映整个攻击过程的详细步骤 序列,实现对整个多阶段攻击过程的细粒度重构;本发明基于检测到的零散攻击事件,从日志信息中重构出多阶段的攻击过程,更加细粒度地复盘了攻击链,更加有利于网络安全员对网络安全状况做出综合评判并进行针对性防御部署。
-
公开(公告)号:CN115063862A
公开(公告)日:2022-09-16
申请号:CN202210731136.4
申请日:2022-06-24
Applicant: 电子科技大学
Abstract: 该发明公开了一种基于特征对比损失的年龄估计方法,属于计算机视觉领域。该方法首先选择注意力机制作为特征提取网络的基本结构,并使用了基于注意力机制的偏移窗口变换网络作为特征提取网络的主要结构,用于从面部图像中提取鲁棒的年龄特征;然后设计了用于计算特征之间相对距离的距离估计网络,通过基于特征的对比损失引导特征空间保留标签空间的序约束关系,使得尾部特征能够利用头部特征的信息,进而提升尾部数据的预测准确度,从而解决年龄估计中的长尾分布问题。
-
公开(公告)号:CN114549863B
公开(公告)日:2022-07-22
申请号:CN202210447954.1
申请日:2022-04-27
Applicant: 西安电子科技大学
Abstract: 本发明公开了一种基于像素级噪声标签监督的光场显著性目标检测方法,包括以下步骤:S1、基于全焦图像及其对应的焦堆栈构建实验数据;S2、通过实验数据交互式引导融合网络,获得全焦图像初始噪声预测和光场焦堆栈图像初始噪声预测;S3、通过全焦图像初始噪声预测和光场焦堆栈图像初始噪声预测构建像素遗忘矩阵,得到融合后的最终预测显著性映射;S4、对融合后的最终预测显著性映射进行跨场景的噪声惩罚损失。本发明通过挖掘高维度光场数据中非常丰富的场景信息来引导和辅助显著性物体的检测,充分利用噪声标签中可用的显著性信息并减小噪声信息的置信度,有效地降低了显著性目标检测的预实验成本。
-
公开(公告)号:CN114581829A
公开(公告)日:2022-06-03
申请号:CN202210207842.9
申请日:2022-03-04
Applicant: 西安电子科技大学
Abstract: 本发明公开了一种基于强化学习的连续手语识别方法、电子设备和存储介质,所述方法包括:构建强化学习网络模块,对连续视频帧进行裁剪处理,获得全身视频帧、手部视频帧和脸部视频帧,分别使用强化学习网络模块挑选其中的核心视频帧,提取各核心视频帧中的特征,拼接各特征获取视频片段,对视频片段进行识别得到连续手语识别句子;本发明降低了视频帧的处理量,提高了手语识别效率,并使手语识别的准确性得到大幅度提升。
-
-
-
-
-
-
-
-
-