-
公开(公告)号:CN118354081A
公开(公告)日:2024-07-16
申请号:CN202410339250.1
申请日:2024-03-22
Applicant: 人工智能与数字经济广东省实验室(深圳) , 深圳大学
IPC: H04N19/149 , G06T9/00 , H04N19/42 , H04N19/124 , H04N19/13 , H04N19/132
Abstract: 本申请适用于图像处理技术领域,提供了一种图像压缩方法、装置、终端设备及存储介质,其中,方法包括:通过编码器对输入图像进行编码,获得输入图像的第一隐式编码信息;然后将第一隐式编码信息输入复合先验模型,获得输入图像的第一统计信息;再对第一隐式编码信息和第一统计信息进行量化处理,获得第一目标隐式编码信息和第一目标统计信息;最后将第一目标隐式编码信息和第一目标统计信息进行熵编码,获得与第一目标隐式编码信息对应的第一比特流数据,以及与第一目标统计信息对应的第二比特流数据。本申请实施例可以有效提高图像压缩效率。
-
公开(公告)号:CN117749653A
公开(公告)日:2024-03-22
申请号:CN202410011109.9
申请日:2024-01-02
Applicant: 人工智能与数字经济广东省实验室(深圳)
Abstract: 本申请提供了一种QoS预测方法、装置、电子设备及可读存储介质。所述方法包括:获取待预测数据集,待预测数据集包括多种指标数据,指标数据包括表征应用底层性能指标的不同实际场景的实际值;将待预测数据集输入至已训练的特征提取模块,获得已训练的特征提取模块输出的对应待预测数据集预测特征向量;将预测特征向量输入至已训练的回归模块,获得已训练的回归模块输出的对应待预测数据集的QoS预测值。本申请对反映云服务的指标数据提取特征向量,根据特征向量预测QoS值,能够及时、准确获得QoS值,提高模块的泛化能力,同时根据多种指标数据预测QoS值,能够提高在复杂的云环境场景下的预测精度。
-
公开(公告)号:CN118279793A
公开(公告)日:2024-07-02
申请号:CN202410412021.8
申请日:2024-04-07
Applicant: 人工智能与数字经济广东省实验室(深圳) , 深圳大学
Abstract: 本申请公开一种视频超分模型及其训练方法、视频处理方法,涉及计算机视觉领域,视频超分模型包括帧对齐模块、特征提取模块和上采样模块,帧对齐模块用于对第一目标帧进行双向传播,得到第一目标帧与相邻帧之间的初始特征;特征提取模块包括深度可分离卷积残差块,深度可分离卷积残差块用于提取第一目标帧和初始特征融合后的特征,得到第一目标帧相对应的目标特征;上采样模块用于根据目标特征和目标权重,生成与第一目标帧相对应的高分辨率图。本申请实施例引入深度可分离卷积确定深度可分离卷积残差块,具有与RDB相同的特征,使得视频超分模型是一种轻量化的任意倍率视频超分模型,减少模型的参数数量,降低视频超分模型的计算量。
-
公开(公告)号:CN118170642A
公开(公告)日:2024-06-11
申请号:CN202410133379.7
申请日:2024-01-30
Applicant: 人工智能与数字经济广东省实验室(深圳) , 深圳光秒传感科技有限公司
Abstract: 本申请适用于智能体决策规划技术领域,提供了一种行为树模型的安全性检测方法及装置,该方法包括:获取目标对象对应的行为树模型,行为树模型用于控制目标对象的决策行为;获取安全约束条件,安全约束条件为目标对象在目标环境下安全运行的约束条件;对行为树模型进行形式化转换,得到状态机模型;基于安全约束条件,对状态机模型进行检测,得到检测结果,检测结果用于指示行为树模型是否满足安全约束条件。本方案能够实现对行为树模型的安全性验证,进而保证目标对象在行为树模型的控制下的运行过程的安全性,避免由于行为树模型的安全性问题而导致目标对象的损坏。
-
公开(公告)号:CN117874488A
公开(公告)日:2024-04-12
申请号:CN202311750518.2
申请日:2023-12-18
Applicant: 人工智能与数字经济广东省实验室(深圳) , 长三角哈特机器人产业技术研究院
IPC: G06F18/213 , G06V10/44 , G06V10/82 , G06N3/0455 , G06N3/045 , G06N3/088
Abstract: 本申请公开了一种零样本学习模型优化方法、装置、设备及存储介质,该方法包括:获取视觉编码器从样本图像中学习到的视觉特征;获取文本数据,将文本数据输入到文本编码器中,获取文本编码器从文本数据中学习到的语义属性特征;通过多模态交互模块使用视觉特征查询语义属性特征,得到第一交互结果,使用语义属性特征查询视觉特征,得到第二交互结果,根据第一交互结果和第二交互结果,将视觉特征和语义属性特征对齐;在零样本学习模型执行优化任务时,采用预设的综合损失函数生成模型,生成优化任务的综合损失函数;基于优化任务的综合损失函数优化零样本学习模型,得到优化后的零样本学习模型。本申请有利于提高零样本学习模型的优化效率。
-
公开(公告)号:CN115761607A
公开(公告)日:2023-03-07
申请号:CN202211442633.9
申请日:2022-11-17
Applicant: 人工智能与数字经济广东省实验室(深圳) , 绿盟科技集团股份有限公司
IPC: G06V20/50 , G06V20/70 , G06V10/764 , G06V10/422 , G06V10/56 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本申请适用于目标识别技术领域,提供了一种目标识别方法、装置、终端设备及可读存储介质,该方法包括:获取加油站作业场景下的作业区域图像,作业区域图像中包含第一待识别目标,第一待识别目标为可见类目标和/或未见类目标;提取第一待识别目标的视觉特征图,得到第一视觉特征图;依据形状、大小、颜色、材质及功能中的至少一项语义维度,基于第一视觉特征图,确定第一待识别目标的第一语义特征向量;基于第一语义特征向量对第一待识别目标所属类别进行识别。本申请可以对加油站作业场景下的可见类目标和未见类目标进行识别。
-
公开(公告)号:CN119759420A
公开(公告)日:2025-04-04
申请号:CN202510265776.4
申请日:2025-03-07
Applicant: 人工智能与数字经济广东省实验室(深圳)
Abstract: 本申请适用于程序迁移技术领域,提供了一种人工智能程序跨平台迁移方法、装置及终端设备,该方法包括:获取源开发平台上的待迁移AI程序的代码数据和目标开发平台的平台配置信息,目标开发平台的计算架构为CANN平台;在代码数据为源码数据时,根据CANN平台的平台配置信息,对源码数据中的多个CUDA API调用接口进行提取和转换,得到多个第一API调用接口;在代码数据为PTX数据时,根据CANN平台的平台配置信息,对PTX数据进行解析和转译,得到IR指令集;控制CANN加速引擎执行第一API调用接口或IR指令集,以将待迁移AI程序从源开发平台迁移至CANN平台,显著简化迁移流程,提升迁移效率。
-
公开(公告)号:CN118013280A
公开(公告)日:2024-05-10
申请号:CN202410102026.0
申请日:2024-01-24
Applicant: 人工智能与数字经济广东省实验室(深圳) , 长三角哈特机器人产业技术研究院
IPC: G06F18/214 , G06N20/20
Abstract: 本申请公开了一种预测模型的训练方法、装置及终端设备,通过获取训练集,并依次将训练集中的输入数据输入至预测模型,生成输入数据对应的预测数据,进而根据输入数据与预测数据对预测模型进行对抗训练,并在对抗训练的过程中,减少预测数据与输入数据之间的差异,进而在对抗训练后生成目标预测模型,以基于目标预测模型预测云平台的工作负载,使得所预测的工作负载与真实的工作负载之间差异较小,提高了预测云平台的工作负载的准确性,从而减少了因对云平台的工作负载预测错误而导致资源分配不均的情况,实现了云平台的资源均匀分配,减少了资源分配不均、资源浪费的问题。
-
公开(公告)号:CN117422613A
公开(公告)日:2024-01-19
申请号:CN202311435325.8
申请日:2023-10-30
Applicant: 人工智能与数字经济广东省实验室(深圳)
Abstract: 本申请适用于计算机视觉技术领域,提供了一种图像处理方法、超分辨率模型训练方法及电子设备。图像处理方法包括:获取原图像以及缩放因子;其中,缩放因子表示目标分辨率与原图像的原分辨率的比值;利用超分辨率模型对原图像和缩放因子进行处理,以得到目标分辨率的目标图像;超分辨率模型是利用训练数据训练得到的,训练数据包括:训练原图像、训练缩放因子和标签目标图像,训练缩放因子表示标签目标图像的训练目标分辨率与训练原图像的训练原分辨率的比值。通过使用同一模型处理不同缩放因子需求的图像,并提高了图像质量,进一步提高了方法的通用性和灵活性,降低了时间复杂度和计算成本。
-
公开(公告)号:CN115761607B
公开(公告)日:2023-10-10
申请号:CN202211442633.9
申请日:2022-11-17
Applicant: 人工智能与数字经济广东省实验室(深圳) , 绿盟科技集团股份有限公司
IPC: G06V20/50 , G06V20/70 , G06V10/764 , G06V10/422 , G06V10/56 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本申请适用于目标识别技术领域,提供了一种目标识别方法、装置、终端设备及可读存储介质,该方法包括:获取加油站作业场景下的作业区域图像,作业区域图像中包含第一待识别目标,第一待识别目标为可见类目标和/或未见类目标;提取第一待识别目标的视觉特征图,得到第一视觉特征图;依据形状、大小、颜色、材质及功能中的至少一项语义维度,基于第一视觉特征图,确定第一待识别目标的第一语义特征向量;基于第一语义特征向量对第一待识别目标所属类别进行识别。本申请可以对加油站作业场景下的可见类目标和未见类目标进行识别。
-
-
-
-
-
-
-
-
-