基于多模态图像生成的工件表面形貌生成方法和装置

    公开(公告)号:CN116977652B

    公开(公告)日:2023-12-22

    申请号:CN202311227139.5

    申请日:2023-09-22

    Abstract: 本发明公开了一种基于多模态图像生成的工件表面形貌生成方法和装置,属于机加工数据处理技术领域,包括:基于不同加工方式的历史数据的多模态信息,构建引导向量;基于扩散模型,对表面形貌灰度图的低维表征加噪得到噪声向量,将引导向量、时间步长和噪声向量输入逆向扩散过程,层层降噪还原出低维表征,实现对模型的训练;提取目标多模态信息构建目标引导向量,将随机噪声隐变量和目标引导向量输入到训练好的扩散模型得到目标低维表征,通过解码器得到目标表面形貌灰度图;采用图像质量综合评价模块进行质量评价。本发明采用扩散模型,实现了多模态信息到表面形貌图像的准确映射,(56)对比文件Fujing Tian等.Theoretical andexperimental investigation on modeling ofsurface topography influenced by thetool-workpiece vibration in the cuttingdirection and feeding direction insingle-point diamond turning《.TheInternational Journal of AdvancedManufacturing Technology》.2016,第86卷第2433-2439页.

    一种基于多帧输入与轨迹平滑的多目标跟踪方法和装置

    公开(公告)号:CN114998999B

    公开(公告)日:2022-12-06

    申请号:CN202210856428.0

    申请日:2022-07-21

    Abstract: 本发明公开一种基于多帧输入与轨迹平滑的多目标跟踪方法和装置,方法包括:步骤S1:获取行人视频数据集并进行行人坐标以及行人轨迹的标注,并生成片段型轨迹数据;步骤S2:构造并训练基于多帧输入与轨迹平滑的行人多目标跟踪网络模型;步骤S3:基于训练得到的行人多目标跟踪网络模型进行推理,获取当前帧行人目标检测与特征提取结果以及其前几帧的行人目标检测与特征提取结果,即获取得到多帧图像目标的坐标及外观特征;步骤S4:利用多帧图像目标的坐标及外观特征进行最短特征距离匹配,并利用轨迹曲率平滑函数进行轨迹平滑,最终得到当前帧的轨迹。本发明具有耗时低,且对同类目标的遮挡问题鲁棒性较好的优点。

    一种基于双目的人体三维关键点检测方法及系统

    公开(公告)号:CN114757822B

    公开(公告)日:2022-11-04

    申请号:CN202210663896.6

    申请日:2022-06-14

    Abstract: 本发明公开一种基于双目的人体三维关键点检测方法及系统,该方法包括:步骤一:通过采用YOLOv5目标检测算法的目标检测模块分别获得左、右视场图像中的人体矩形框;步骤二:扣取人体矩形框对应的人体图像,通过人体二维关键点识别算法提取左、右视场图像中人体各关键点的二维热力图;步骤三:将左、右人体二维关键点热力图反向投影到三维空间,得到三维反投影热力图;步骤四,将三维反投影热力图输入三维卷积编解码网络,通过编解码操作得到三维关键点热力图;步骤五,三维关键点热力图中每一通道通过自变量最大值软操作得到该通道表示的三维关键点所在坐标,最终得到全部人体三维关键点坐标。本发明具有较高的可行性和实用性。

    基于交叉卷积注意力对抗学习的人脸超分辨方法和装置

    公开(公告)号:CN114757832B

    公开(公告)日:2022-09-30

    申请号:CN202210663897.0

    申请日:2022-06-14

    Abstract: 本发明公开一种基于交叉卷积注意力对抗学习的人脸超分辨方法和装置,该方法将原始低分辨率图像输入人脸超分辨生成网络,经过卷积层、若干个全局残差通道注意力单元、粗上采样模块、两批局部残差通道注意力单元、精上采样模块,得到目标分辨率图像,再通过索贝尔算子获得边缘信息,通过低倍率降采样处理并反馈到主网络中进一步提高超分辨效果,利用小波变换将目标分辨率图像、真值图像和其他通过数据增强方式得到的图像进行分解,每个图像分解成一个低频信息、两个中频信息和一个高频信息,然后去掉低频信息,融合中频和高频信息,将其送到对抗网络进行判别,最后引入数据增强方法,以产生多个正负样本进行对抗网络与人脸超分辨网络的迭代优化。

    基于时间一致性对比学习的动作规范性检测方法和装置

    公开(公告)号:CN114648723A

    公开(公告)日:2022-06-21

    申请号:CN202210454687.0

    申请日:2022-04-28

    Abstract: 本发明涉及智能视频监控及深度学习领域,尤其涉及一种基于时间一致性对比学习的动作规范性检测方法和装置,该方法为:首先将第一数量标注和第二数量未标注的通过摄像头采集的视频构建数据集,第一数量小于第二数量;然后将未标注视频经过强弱数据增强后提取特征,再输入时间一致性行为对齐网络,输出特征图和不同样本间相似动作起始与结束帧集合,映射集合在特征图上对应子特征图,构造同类与不同类子特征图样本,送入对比学习网络提取时空判别性特征;再将第一数量标注视频送入预训练后的网络进行迁移学习,输出行为类别;最后通过帧间行为类别变化判断行为规范性,若不规范则发出预警。

    一种基于无监督学习的行人重识别方法

    公开(公告)号:CN113822262B

    公开(公告)日:2022-04-15

    申请号:CN202111412831.6

    申请日:2021-11-25

    Abstract: 本发明公开了一种基于无监督学习的行人重识别方法,在特征存储器中只保存聚类得到的类中心,采用分组采样的方式获取小样本集,并结合难例挖掘的方法更新存储器中的特征向量和特征提取网络模型参数,实现了在无标签数据集上的伪标签自动生成,增强了模型对于噪声数据的鲁棒性,大大减小了存储器对于内存空间的高额要求。本发明剔除了离群样本点对聚类中心的干扰,避免了随机采样导致的过拟合等问题,在小样本迭代过程中不更改数据标签,降低了标签跳变等噪声数据对于模型稳定性的影响,加速了模型的收敛,提高行人重识别模型在不同场景下的泛化能力。

    一种基于预训练生成模型的人脸超分辨方法

    公开(公告)号:CN113379606A

    公开(公告)日:2021-09-10

    申请号:CN202110934749.3

    申请日:2021-08-16

    Abstract: 本发明属于计算机视觉、图像处理领域,涉及一种基于预训练生成模型的人脸超分辨方法,包括:步骤一、采集并将低分辨率图像输入至特征提取模块,提取特征信息;步骤二、将特征信息输入至编码器,得到通道数为输入尺寸8倍的隐式矩阵,隐式矩阵通过分离模块特征分解后获得隐式向量,与人脸标签数据通过级联方式,分别输入至预训练生成模型中,得到生成特征;步骤三、将生成特征传递给解码器,并融合特征提取模块提取的特征信息,经解码操作后输出目标高分辨率图像。本发明可以将低分辨率的人脸进行高倍率的放大,最高可以获得64倍的超分结果,并且超分辨结果保持较好的保真性,使放大的图像在保真度和纹理真实度方面有更好的改进。

    一种基于特征扩增的无监督夜间图像分类方法

    公开(公告)号:CN112990371A

    公开(公告)日:2021-06-18

    申请号:CN202110459160.2

    申请日:2021-04-27

    Abstract: 本发明属于计算机视觉识别技术领域,涉及一种基于特征扩增的无监督夜间图像分类方法。采用具有白天图像分类标签的公开数据集训练分类网络,经分类网络提取输入图像的特征向量,并计算各类别的特征均值与协方差矩阵;将无标签的夜间图像输入分类网络获得该图像的伪标签,根据伪标签计算夜间图像各类别在特征空间的特征均值与协方差矩阵;对同类别的白天、夜间图像获取的协方差矩阵进行加权平均获得最终协方差矩阵;根据各类别夜间图像特征均值和加权平均后的协方差矩阵进行特征采样;将采样的特征值与原有特征值共同重新训练分类网络。本发明通过学习有标签的白天图像的特征分布,在特征层面对夜间数据进行扩增,从而实现对夜间图像的无监督分类。

Patent Agency Ranking