-
公开(公告)号:CN119445660A
公开(公告)日:2025-02-14
申请号:CN202411491776.8
申请日:2024-10-24
Applicant: 电子科技大学
IPC: G06V40/20 , G06V10/30 , G06V10/26 , G06V10/762 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/0499 , G06N3/045
Abstract: 本发明提供一种基于多任务学习的毫米波多人动作识别方法,利用毫米波雷达采集动作数据,通过聚类分割点云数据获得多人数据。分割后的数据经过预处理生成点云轨迹和压缩多普勒图,通过特征提取获得时序和空间特征信息,融合后得到动作特征表征。动作特征通过多任务学习模型中的多任务特征提取结构和门控机制进行进一步特征提取与加权过滤。多任务深度学习模型通过对不同任务数据进行共享表示和独立表示,能够在同一模型中同时实现动作模式判别、独立动作识别和交互动作识别三个任务,从而实现在预先未知人数和动作模式情况下的单人动作识别、多人独立动作识别、多人交互动作识别,既能提高毫米波多人动作识别的准确性,也能保证其识别实时性。
-
公开(公告)号:CN119167092A
公开(公告)日:2024-12-20
申请号:CN202411364076.2
申请日:2024-09-28
Applicant: 电子科技大学
IPC: G06F18/214 , G06F40/30 , G06F40/194 , G06N5/02
Abstract: 本发明公开了基于LLM的预训练语言模型的去偏方法、系统、存储介质及终端,属于语言处理领域,主要包括:S1、利用大语言模型生成社会常识性知识;S2、使用结构因果模型估计生成的社会常识性知识的碰撞效应,筛选出与预训练语言模型隐空间对齐的社会常识性知识;对于未对齐的社会常识性知识,使用偏见规避策略进行规避;S3、基于筛选结果对预训练语言模型进行训练和优化。本发明通过引入LLMs生成的社会常识性知识,来克服传统方法中存在的数据质量问题,并有效减轻PLMs中的社会偏见。同时通过估计碰撞效应,能够识别并利用对齐的知识来实现正迁移,减少PLMs对非对齐知识的学习负担。
-
公开(公告)号:CN118536049A
公开(公告)日:2024-08-23
申请号:CN202411002747.0
申请日:2024-07-25
Applicant: 中国电子科技集团公司第三十研究所 , 电子科技大学 , 四川日报网络传媒发展有限公司
IPC: G06F18/2433 , G06F18/213 , G06F18/25 , G06F18/23 , G06F18/22 , G06N3/0455
Abstract: 本发明公开了一种基于多模态异常内容理解的内容主体发现方法,其包括:对多模态数据中的图像、视频、多个音频片段、文本和OCR文本进行特征提取,分别得到图像特征矩阵、视频特征矩阵、音频特征矩阵和文本特征矩阵;将图像特征矩阵、视频特征矩阵、音频特征矩阵与文本特征矩阵进行融合,得到特征矩阵;将特征矩阵在大语言模型上进行LoRA指令监督微调,为大语言模型的输出增加投影层,从大语言模型的输出中提取异常内容和异常内容主体的特征向量;使用向量数据库存储该特征向量,并对该特征向量进行聚类和距离计算,并根据阈值判断是否属于相同的内容主体,生成多模态融合的异常内容报告。本发明提高了异常内容识别的准确性和内容主体发现的效率。
-
公开(公告)号:CN118294963A
公开(公告)日:2024-07-05
申请号:CN202410307023.0
申请日:2024-03-18
Applicant: 电子科技大学
Abstract: 本发明提供一种基于声波FMCW的高精度实时人体测距方法,基于感知区域内人体对声波信号的反射,通过提取发射声波与接收声波的互相关包络实现对静止和运动人体的实时测距。将每个周期直射信号的接收时间作为测距起始时间。本发明基于人体运动的连续性,在起始时间段内提取所有可能的互相关包络,选择波动最小的波峰序列对应的距离作为人体的初始距离。鉴于人体运动引入了额外的多径信息,提取到的互相关包络中可能存在干扰峰,本发明通过结合静态包络消除和前后周期包络相减的方法来消除这些干扰,提高对运动人体的测距精度。为解决实时性不足的问题,本发明基于上一周期人体波峰位置,在当前周期的候选波峰中选择最接近者作为测距结果。
-
公开(公告)号:CN117475081A
公开(公告)日:2024-01-30
申请号:CN202311456845.7
申请日:2023-11-03
Applicant: 电子科技大学
IPC: G06T17/00 , G06T19/20 , G06V10/26 , G06V10/762 , G06V20/64
Abstract: 本发明公开了基于NURBS的无序点云曲面重建方法,包括点云预处理步骤和曲面重建步骤;所述曲面重建步骤包括以下子步骤:使用频域滤波将所述分割点云分为高频点云和低频点云;分别对高频点云和低频点云分别进行NURBS拟合,得到高频NURBS拟合曲面和低频NURBS拟合曲面;将所述高频NURBS拟合曲面和低频NURBS拟合曲面进行融合。本发明的点云预处理的步骤,可以通过融合多种表面信息得到更加准确预处理结果;同时通过曲面重建步骤,避免了因噪声过多、滤波效果不理想导致的曲线拟合误差过大,导致后续曲面拟合误差进一步增大的问题,使用该种方法可以减小因点云滤波后仍存在的噪点产生的拟合误差。
-
公开(公告)号:CN117315372A
公开(公告)日:2023-12-29
申请号:CN202311429741.7
申请日:2023-10-31
Applicant: 电子科技大学
IPC: G06V10/764 , G06V10/762 , G06V10/26 , G06V10/22 , G06V10/77 , G06T5/00 , G06N3/044 , G06N3/09
Abstract: 本发明公开了一种基于特征增强的三维感知方法,包括:将获取到的RGB图像输入至2D检测器进行目标检测,得到作为区域建议的包围框信息,每个包围框信息针对于一个目标;得到原始点云在RGB图像上的前景点;得到从RGB图像到3D空间形成的截锥体;得到特征补全后的补全点云;将补全点云的点云信息、区域建议信息和质心信息进行维度拼接,得到拼接点云;将拼接点云送入分割网络进行实例分割,输出实例目标的3D包围盒信息。本发明利用球查询策略进行关键信息补全,意在基于原始点云,为下采样后实例物体附近的点云进行信息补全;同时基于多级连接的特征扩充策略,为特征提取后的每个点提供额外语义信息,提升了回归网络的包围盒回归效果。
-
公开(公告)号:CN112927353B
公开(公告)日:2023-05-19
申请号:CN202110210926.3
申请日:2021-02-25
Applicant: 电子科技大学
Abstract: 本发明公开了基于二维目标检测和模型对齐的三维场景重建方法、存储介质及终端,属于三维场景重建技术领域,方法包括获取图像的包围框信息,根据图像的包围框信息结合相机内参计算三维空间中的视锥体范围,并根据视锥体范围对待重建的扫描场景进行裁剪;在裁剪后的扫描场景进行模型检索、模型对齐处理,得到与裁剪后的扫描场景模型匹配的对象模型;预测所有与裁剪后的扫描场景模型匹配的第一对象模型的位置姿态参数,根据位置姿态参数使第一对象模型替换扫描场景中的对应点云,实现三维场景的重建。本发明在裁剪后的扫描场景进行模型检索、模型对齐处理,减小了模型检索、模型对齐的计算量,加快了三维场景重建的计算速度,三维场景重建效率高。
-
公开(公告)号:CN111626156B
公开(公告)日:2023-05-09
申请号:CN202010406802.8
申请日:2020-05-14
Applicant: 电子科技大学
IPC: G06V40/10 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于行人掩模和多尺度判别的行人生成方法,具体包括:将行人掩模输入到生成器中生成行人图像;判别器通过对行人掩模和生成行人图像组成的图像对进行判别;判别器将判别结果返回给生成器,指导生成器继续生成更符合行人掩模姿态的行人图像。本发明使用了多尺度判别方式,包含了多个判别器,分别对不同尺度行人掩模和生成行人组成的图像对进行判别。本方法证明了基于行人掩模和多尺度判别的方法能生成具有特定掩模姿态的行人且生成图像更精细化,行人轮廓与背景边界更清晰。
-
公开(公告)号:CN115409155A
公开(公告)日:2022-11-29
申请号:CN202210983826.9
申请日:2022-08-17
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于Transformer增强霍克斯过程的信息级联预测系统及方法,包括用户嵌入模块、全局依赖模块、局部依赖模块、强度函数获取模块和流行度预测模块,首先获取用户position‑wise嵌入和时间编码作为用户嵌入,然后以拓扑结构的视角,引入路径感知假设,并从全局嵌入和局部模式两个角度设计两层注意力层,参数化霍克斯过程的强度函数,并结合霍克斯过程、全局嵌入和局部模式,学习信息级联扩散过程耦合的时间和拓扑随机特性,以进行流行度预测;本发明扩展了传统的霍克斯过程,并有效地从连续时间域中获取知识,提升流行度预测准确性。
-
公开(公告)号:CN114612767B
公开(公告)日:2022-11-15
申请号:CN202210243982.1
申请日:2022-03-11
Applicant: 电子科技大学
Abstract: 本发明公开一种基于视觉场景图生成的图像内容理解与表达方法、系统与存储介质,应用于图像理解与表达领域,针对现有技术存在的图像表达准确率和效率均较低的问题;本发明提出了基于关键中心点估计的视觉场景图生成方法,不使用大量目标检测锚框和后处理手段,提升了场景图生成的准确率和效率,并充分理解了图像内容本身里目标实体和实体之间、实体和属性、实体和背景之间的关系,使得图像内容表达语句更准确、更贴近图像内容本身;本发明还引入先验语料知识,补足场景图生成过程中关系谓词等词汇输出的缺失,提升了图像内容理解与表达的表达语句准确率和拟人化水平;相比于现有技术,本发明的图像表达准确率和效率均有显著的提升。
-
-
-
-
-
-
-
-
-