一种基于多类表征时空交互的人脸时空表征生成方法

    公开(公告)号:CN116071809A

    公开(公告)日:2023-05-05

    申请号:CN202310285315.4

    申请日:2023-03-22

    Abstract: 本发明公开了一种基于多类表征时空交互的人脸时空表征生成方法,本发明通过同时学习人脸局部表征与人脸不同区域间的人脸关系表征,并为两种表征的时空动态交互建模,实现不同时刻同类表征之内和不同类表征之间的时空交互,最终得到更可靠的人脸时空表征。解决了目前人脸时空表征学习采用卷积神经网络提取人脸局部表征的方法,忽略了人脸不同区域之间的高层关系信息,导致生成的人脸时空表征的有效性较低的问题。

    面向机器视觉的数据处理方法、装置、设备及介质

    公开(公告)号:CN119420940B

    公开(公告)日:2025-04-08

    申请号:CN202510019861.2

    申请日:2025-01-07

    Abstract: 本申请实施例提供了一种面向机器视觉的数据处理方法、装置、设备及介质,属于视觉数据处理技术领域。方法包括:将获取到的初始视觉信息输入训练好的端侧压缩模型中,通过多层次编码器对初始视觉信息进行不同类型的特征提取,得到各个层次下相应类型的编码特征;基于视觉码本对各编码特征分别进行矢量量化处理得到相应类型的压缩信息,以使边云侧系统在接收到的各类型下的压缩信息之后,通过多层次解码器对不同类型压缩信息表征的编码特征进行特征重构,得到各个层次下相应类型的解码特征,进而得到与初始视觉信息匹配的目标视觉信息。本申请能够提高视觉数据的传输效率。

    交通流量预测方法、装置、设备和存储介质

    公开(公告)号:CN119600799A

    公开(公告)日:2025-03-11

    申请号:CN202411609369.2

    申请日:2024-11-12

    Abstract: 本申请实施例提供交通流量预测方法、装置、设备和存储介质,涉及数据处理技术领域。该方法获取多个位置节点的交通流量数据生成始发流量矩阵,并对始发流量矩阵进行数据优化得到输入流量矩阵,将输入流量矩阵输入相关性预测子模型进行相关性分析,得到第一输出矩阵,分别利用门控卷积子网络对输入流量矩阵进行数据处理,得到对应的第一门控数据,根据两个第一门控数据得到第二门控数据,将第二门控数据和输入流量矩阵共同输入图卷积网络进行数据处理得到第一输出矩阵,将第一输出矩阵输入输出预测层进行数据处理,得到位置节点对应的目的流量矩阵。基于交通流量预测模型获取的双向空间相关性和时间相关性进行预测,提高交通流量预测的准确性。

    视觉语言模型的训练方法、文本生成方法以及相关设备

    公开(公告)号:CN118861214B

    公开(公告)日:2024-12-03

    申请号:CN202411351960.2

    申请日:2024-09-26

    Abstract: 本申请实施例提供了一种视觉语言模型的训练方法、文本生成方法以及相关设备,尤其涉及计算机视觉技术领域。该方法包括:将包含样本文本的样本图像文本对输入至初始视觉语言模型中;将基于样本文本分词得到多个样本子词与预设的多个初始子词进行匹配,确定与初始子词不同的样本子词为新语言下的目标子词;基于为目标子词分配对应的目标嵌入参数对目标子词进行词嵌入处理,利用词嵌入处理得到的目标嵌入特征对样本图像文本对进行视觉语言处理,得到样本输出文本;为目标子词分配对应的目标加权系数,基于目标加权系数和样本输出文本调整目标嵌入参数,得到训练后的视觉语言模型。本申请能够在计算资源受限的情况下,提高视觉语言模型的泛化能力。

    模型间的特征向后兼容学习方法、电子设备及存储介质

    公开(公告)号:CN118690201B

    公开(公告)日:2024-11-12

    申请号:CN202411155676.8

    申请日:2024-08-22

    Abstract: 本申请提出了一种模型间的特征向后兼容学习方法,通过获取第一分类模型、第二分类模型以及训练数据集;基于第一分类模型以及第二分类模型计算每个子数据集对应的第一特征值以及第二特征值;对第一特征值进行扰动计算,得到对应的第三特征值;基于第二分类模型计算每个数据样本对应的目标特征向量,并根据目标特征向量与第一特征值之间构造负样本对,根据目标特征向量与第三特征值之间构造正样本对,计算得到第一损失函数;基于第二分类模型对训练数据集进行分类,根据第二分类模型的分类正确率计算得到第二分类模型的第二损失函数;基于第一损失函数以及第二损失函数更新第二分类模型的模型参数。该方法能够提高新模型的判别能力。

    视觉语言模型的训练方法、文本生成方法以及相关设备

    公开(公告)号:CN118861214A

    公开(公告)日:2024-10-29

    申请号:CN202411351960.2

    申请日:2024-09-26

    Abstract: 本申请实施例提供了一种视觉语言模型的训练方法、文本生成方法以及相关设备,尤其涉及计算机视觉技术领域。该方法包括:将包含样本文本的样本图像文本对输入至初始视觉语言模型中;将基于样本文本分词得到多个样本子词与预设的多个初始子词进行匹配,确定与初始子词不同的样本子词为新语言下的目标子词;基于为目标子词分配对应的目标嵌入参数对目标子词进行词嵌入处理,利用词嵌入处理得到的目标嵌入特征对样本图像文本对进行视觉语言处理,得到样本输出文本;为目标子词分配对应的目标加权系数,基于目标加权系数和样本输出文本调整目标嵌入参数,得到训练后的视觉语言模型。本申请能够在计算资源受限的情况下,提高视觉语言模型的泛化能力。

    人体姿态识别方法、装置、计算机设备及可读存储介质

    公开(公告)号:CN118692153A

    公开(公告)日:2024-09-24

    申请号:CN202411155779.4

    申请日:2024-08-22

    Abstract: 本申请实施例提供了一种人体姿态识别方法、装置、计算机设备及可读存储介质。方法包括:获取图像帧序列,并从中获取第一图像帧以及位于第一图像帧前序的第二图像帧、后序的第三图像帧;将第一图像帧、第二图像帧和第三图像帧输入至目标模型中,得到第一热图、第二热图和第三热图;根据各图像帧的帧距离,确定热图之间的融合权重比例;通过目标模型的姿态融合残差模块,对各热图进行融合修正,得到第一特征张量;通过目标模型的差分融合残差模块,对第一热图、第一差异热图和第二差异热图进行融合修正,得到第二特征张量;根据第一特征张量和第二特征张量对第一热图进行修正,生成人体姿态识别结果。以此,提高了对人体姿态识别的准确性和稳定性。

    模型间的特征向后兼容学习方法、电子设备及存储介质

    公开(公告)号:CN118690201A

    公开(公告)日:2024-09-24

    申请号:CN202411155676.8

    申请日:2024-08-22

    Abstract: 本申请提出了一种模型间的特征向后兼容学习方法,通过获取第一分类模型、第二分类模型以及训练数据集;基于第一分类模型以及第二分类模型计算每个子数据集对应的第一特征值以及第二特征值;对第一特征值进行扰动计算,得到对应的第三特征值;基于第二分类模型计算每个数据样本对应的目标特征向量,并根据目标特征向量与第一特征值之间构造负样本对,根据目标特征向量与第三特征值之间构造正样本对,计算得到第一损失函数;基于第二分类模型对训练数据集进行分类,根据第二分类模型的分类正确率计算得到第二分类模型的第二损失函数;基于第一损失函数以及第二损失函数更新第二分类模型的模型参数。该方法能够提高新模型的判别能力。

    视频数据处理方法、装置、电子设备及存储介质

    公开(公告)号:CN118138801A

    公开(公告)日:2024-06-04

    申请号:CN202410559070.4

    申请日:2024-05-08

    Abstract: 本申请实施例提出的视频数据处理方法、装置、电子设备及存储介质,该方法通过首先,获取目标任务的视频数据,对视频数据进行数据解码得到多个解码数据帧,目标任务包括任务帧率以及任务最低帧率;然后,获取目标设备中的算法消耗解码数据帧的处理参数,并基于所述处理参数确定抽帧速率,当抽帧速率不小于任务最低帧率时,根据抽帧速率从多个解码数据帧中选取至少一个解码数据帧发送至缓存区,逐一从缓存区中选取解码数据帧进行数据处理,得到目标输出数据;当抽帧速率小于任务最低帧率时,选取与目标任务匹配的协同处理设备进行数据处理,以提高处理目标任务的可靠性、实时性和平滑性。

    目标检测方法、电子设备及其存储介质

    公开(公告)号:CN117788795A

    公开(公告)日:2024-03-29

    申请号:CN202311782180.9

    申请日:2023-12-21

    Abstract: 本申请实施例提出的目标检测方法、电子设备及其存储介质,通过获取检测图片的多个检测特征单元,并将多个检测特征单元进行第一预测处理,得到每个检测特征单元的预测概率序列和特征位置序列;然后基于预测概率序列和特征位置序列选取多个候选位置;再获取每个候选位置对应的评价指标,并基于评价指标从候选位置中选取目标位置;其中,评价指标用于指示候选位置与其他候选位置之间的空间位置信息;最后,将目标位置和检测特征单元输入第一变换网络进行目标识别,得到检测图片的目标检测结果和分类识别结果。从而在针对图像目标识别过程中,考虑了候选位置的空间分布信息以得到更加精准的目标位置,以提高对检测图像进行目标识别的精准度。

Patent Agency Ranking