-
公开(公告)号:CN116311477A
公开(公告)日:2023-06-23
申请号:CN202310543543.7
申请日:2023-05-15
Applicant: 华中科技大学
IPC: G06V40/16 , G06N3/0475 , G06N3/048 , G06N3/08 , G06V10/44 , G06V10/764 , G06V10/82
Abstract: 本发明属于计算机视觉与情感计算领域,具体涉及一种面向跨身份一致性的面部运动单元检测模型构建方法,包括:提出一种训练样本选择策略,提高每帧图像的困难正样本和困难负样本在训练样本集中的占比;还提出对比学习,在每次迭代训练时,计算第一对比损失,用于引导分离模块输出的相同身份的身份特征嵌入编码在空间中距离相近,不同身份的身份特征嵌入编码在空间中距离远离;计算第二对比损失,用于引导分离模块输出的相同面部运动单元标签的面部运动特征嵌入编码在空间中距离相近,不同面部运动单元标签的面部运动特征嵌入编码在空间中距离远离。本方法通过隐式地引入面部运动单元跨身份一致性定义先验知识,使得模型有效学习面部运动单元表征。
-
公开(公告)号:CN116129375A
公开(公告)日:2023-05-16
申请号:CN202310410770.2
申请日:2023-04-18
Applicant: 华中科技大学
IPC: G06V20/54 , G06N3/0442 , G06N3/0464 , G06N3/048 , G06N3/08 , G06V10/44 , G06V10/764 , G06V10/80 , G06V10/82
Abstract: 本发明公开了一种基于多曝光生成融合的弱光车辆检测方法,属于计算机视觉技术领域。本发明设计了多曝光生成融合网络,实现了端到端的图像增强与车辆检测的功能,并可以使任意检测框架与本发明兼容;在多曝光生成网络中选取了双输入单输出的卷积循环模块来避免过度平滑与过度曝光问题,并设计单门控记忆单元来进行实现;在伪监督预训练时,设计了SMAE与SSIM相结合的损失函数,综合了整体视觉质量与像素值误差这两点进行计算;在端到端训练的损失函数中,加入双平衡因子损失函数,使损失函数重点关注暗光下难以检测的车辆样本;在多曝光生成网络与多曝光融合网络之间加入压缩激励网络,并使用卷积核通道维膨胀的方法来完成两个网络的融合对接。
-
公开(公告)号:CN115118977B
公开(公告)日:2022-11-04
申请号:CN202211039982.6
申请日:2022-08-29
Applicant: 华中科技大学
IPC: H04N19/149 , H04N19/159 , H04N19/169 , H04N19/176 , H04N19/96
Abstract: 本发明公开了一种针对360度视频的帧内预测编码方法、系统及介质,属于视频编码领域,方法包括:对当前CU块进行帧内块划分时,将待划分CU块的特征输入各划分方式对应的神经网络中,并跳过神经网络输出小于相应输出阈值的划分方式,得到多种帧内块划分方案,待划分CU块为当前CU块或每次帧内块划分后得到的子CU块;帧内角度模式选择时,根据子CU块的编码单元特征和纹理特征确定其RMD候选列表的长度n来进行帧内角度模式选择,以对各帧内块划分方案进行像素填充;计算像素填充后各帧内块划分方案与当前CU块之间的RDO损失,并基于最小RDO损失对应的方案对当前CU块进行帧内预测编码。减少传统编码方法中不必要的过程,降低编码时间。
-
公开(公告)号:CN114898471A
公开(公告)日:2022-08-12
申请号:CN202210812319.9
申请日:2022-07-12
Applicant: 华中科技大学
IPC: G06V40/20 , G06V10/46 , G06V10/75 , G06V10/82 , G06V20/40 , G06V40/10 , G06N3/04 , G06T7/66 , G08B21/04
Abstract: 本发明公开了一种基于人体骨架特征的行为检测方法及存储介质,属于计算机视觉技术领域,包括:提取视频流各帧内各人物目标的一系列人体关键点,作为人体骨架特征;对于每一帧中的每一个人物目标,利用其人体骨架特征计算人体结构中心点和近似刚性运动区域,作为骨架特征状态计算值,并估计下一帧中各人物目标的骨架特征状态估计值;根据骨架特征状态的估计值和计算值进行人物目标匹配后,将属于同一个人物目标的人体骨架特征关联到一起,得到各人物目标的骨架特征序列,并将其中的各关键点的特征在时间域上进行关联,得到时空域骨架特征;将时空域骨架特征输入至行为检测模型,得到对应的行为类别。本发明能够提高多人场景下行为检测的精度。
-
公开(公告)号:CN113743389B
公开(公告)日:2022-02-15
申请号:CN202111309957.0
申请日:2021-11-08
Applicant: 武汉烽火信息集成技术有限公司 , 湖北省人民检察院 , 华中科技大学
IPC: G06V40/16 , G06V10/44 , G06V10/774 , G06K9/62
Abstract: 本发明公开了一种面部表情识别的方法、装置和电子设备,属于图像识别领域,所述方法包括:根据多个面部肌肉关键点将人脸区域划分为多个ROI,获得多个ROI交集对应的最小外接矩形区域Iu和并集对应的最小外接矩形区域In;获得人脸图像对应特征图f的特征图和,将和进行信道拼接得到fc;将fc输入对应的训练好的面部AU识别模型使其输出对应的AU关键点区域及其置信度;将AU关键点区域对应Iu和In进行回归迭代直至Iu=In得到最佳AU关键点区域;基于预设表情映射关系和至少一个最佳AU关键点区域获取人脸图像中的面部表情。本发明通过不断迭代训练得到最佳AU关键点区域并基于此进行表情识别,能够有效提高表情识别效率。
-
公开(公告)号:CN114025167A
公开(公告)日:2022-02-08
申请号:CN202111255832.4
申请日:2021-10-27
Applicant: 华中科技大学
IPC: H04N19/182 , H04N19/147 , H04N19/103 , H04N19/593
Abstract: 本发明公开了一种用于屏幕内容的帧内预测编码方法、设备及介质,属于视频编码领域,包括:对于当前预测单元,利用已知相对位置和像素值的参考像素拟合用于根据像素相对位置预测像素值的线性模型,将其作为回归模式的预测模型,并利用回归模式替代Planar模式;确定回归模式和DC模式中误差较小的预测模式,并将其连同所有帧内预测角度模式进行模式粗选,得到粗选列表;构建当前预测单元的MPM列表,与粗选列表进行合并去重,得到候选模式列表;将候选模式列表中率失真代价最小的预测模式作为当前预测单元的最佳预测模式,并按照最佳预测模式对当前预测单元进行预测编码。本发明能够提高预测精度,并降低编码码率,从而提升帧内预测编码的整体编码性能。
-
公开(公告)号:CN110322471B
公开(公告)日:2021-02-19
申请号:CN201910648517.4
申请日:2019-07-18
Applicant: 华中科技大学
IPC: G06T7/20
Abstract: 本申请实施例提供一种全景视频浓缩的方法、装置、设备及存储介质。该方法包括:获取第一视频中的各预选运动目标的预选运动轨迹,该各预选运动目标的预选运动轨迹经过分割线所对应的位置,该第一视频是全景视频经该分割线分割后得到的;根据各预选运动目标的预选运动轨迹,获取各预选运动目标经过该位置时的运动特征,并根据该运动特征,合并对应同一运动目标的预选运动轨迹,得到合并后的运动轨迹;根据该合并后的运动轨迹,获取该全景视频浓缩后的视频。本申请实施例所提供的技术方案,避免了在全景视频浓缩的过程中将相同运动目标的运动轨迹跟踪为多个运动目标的多条运动轨迹的问题,提高了全景视频浓缩的准确性。
-
公开(公告)号:CN106228121B
公开(公告)日:2019-12-06
申请号:CN201610559968.7
申请日:2016-07-15
Applicant: 华中科技大学
IPC: G06K9/00
Abstract: 本发明公开了一种手势特征识别方法和装置。该手势特征识别方法包括:计算手势深度图序列的帧与帧之间的相似性,得到计算结果;根据计算结果将手势深度图序列分解成多个子序列;提取多个子序列中每个子序列的关键节点,其中,关键节点为每个子序列中符合预设条件的帧;将关键节点组成手势深度图序列的关键点集合;以及根据关键点集合进行手势识别,得到手势识别结果。通过本发明,解决了时域冗余信息多导致手势特征的描述性低的问题。
-
公开(公告)号:CN110321492A
公开(公告)日:2019-10-11
申请号:CN201910508936.8
申请日:2019-06-13
Applicant: 华中科技大学
IPC: G06F16/9536 , G06Q50/00
Abstract: 本发明公开了一种基于社区信息的项目推荐方法及系统,属于个性化推荐领域,包括:根据用户的历史评分信息建立评分矩阵R,并将记录有用户社交信息的社交网络划分为多个社区后,根据用户与社区的从属关系建立社区矩阵C;通过概率矩阵分解,将评分矩阵R分解为用户特征矩阵U和项目特征矩阵V,并将社区矩阵C分解为用户社区特征矩阵A和社区特征矩阵B;根据社区对用户偏好的影响,确定进行概率矩阵分解的目标函数,并根据目标函数对分解结果进行迭代优化,以使得目标函数取极小值;根据目标函数 取极小值时的用户特征矩阵U和项目特征矩阵V,预测各用户对各项目的评分,以根据预测评分完成项目推荐。本发明能够提高项目推荐的准确度,并解决冷启动问题。
-
公开(公告)号:CN107592538B
公开(公告)日:2019-07-23
申请号:CN201710794281.6
申请日:2017-09-06
Applicant: 华中科技大学
IPC: H04N19/147 , H04N19/176 , H04N19/597
Abstract: 本发明公开了一种降低立体视频深度图编码复杂度的方法,主要用于降低3D‑HEVC中深度图像边缘的编码复杂度,包括:用K均值聚类将输入的深度图PU块像素分为两个差异明显的类别,生成K均值聚类模板;计算K均值聚类模板与在编码初始化时生成的楔形分割模板的相似匹配度,并记录最佳相似匹配度和它所对应的楔形分割模板的索引值;根据最佳相似匹配度确定寻找最佳楔形分割模板的搜索半径,计算搜索半径内所有楔形分割模板的率失真,找到率失真最小的最佳楔形分割模板。本发明摒弃了需要在编解码端提前储存楔形节点的搜索方式,节省了系统缓存,降低了DMM1模式的计算复杂度,能够在保证编码质量的同时平均节省7.1%的总编码时间。
-
-
-
-
-
-
-
-
-