一种层级化网络结构搜索方法、设备及可读存储介质

    公开(公告)号:CN111860495B

    公开(公告)日:2022-05-17

    申请号:CN202010568944.4

    申请日:2020-06-19

    Abstract: 本发明提供一种层级化网络结构搜索方法、设备及可读存储介质,包括:S1,构建超网络;S2,获取图像数据并分别作为超网络的网络参数、结构参数的训练数据;S3,生成特征图,计算网络参数的交叉熵损失函数,更新超网络的网络参数;S4,生成特征图和KL散度损失函数,计算结构参数的交叉熵损失函数,得到半隐含变分丢弃损失函数,训练更新超网络的结构参数并得到丢弃概率;S5,利用丢弃概率更新基本单元,更新退火参数;重复S3~S5,更新网络参数和结构参数;S6,得到最终网络。本发明在保证较高的性能同时大幅度减少搜索时间和降低计算复杂度,保证了搜索的稳定性和实用性,可用于图像目标检测、分类等领域,提高图像处理速度。

    一种最大化互信息的图像分类方法、设备、介质及系统

    公开(公告)号:CN113936173A

    公开(公告)日:2022-01-14

    申请号:CN202111170350.9

    申请日:2021-10-08

    Abstract: 本发明提供一种最大化互信息的图像分类方法、设备、介质及系统,包括:采集训练图像;最大化训练图像和神经网络结构的互信息,自动确定神经网络的网络结构和参数;采用得到的所述神经网络对待分类的图像数据进行处理,得到图像分类结果。本发明基于给定图像数据,通过最大化互信息方式,自动设计确定神经网络的网络结构和参数,用于图像分类,无需繁杂的人工设计,节省人力资源和计算资源消耗。本发明能在极短的时间内,自动设计得到基于神经网络的图像分类方法,同时能实现较高的图像分类准确率。

    一种自调整采样优化的图像分类方法、设备及介质

    公开(公告)号:CN113673591A

    公开(公告)日:2021-11-19

    申请号:CN202110931387.2

    申请日:2021-08-13

    Abstract: 本发明提供一种自调整采样优化的图像分类方法、设备及介质,包括:获取训练图像;最小化训练图像分类的交叉熵,自动确定深度神经网络的网络结构和参数;采用得到的所述深度神经网络对待分类图像进行处理,得到图像分类结果。本发明能基于给定的图像数据,自动调整设计基于深度神经网络的图像分类方法,减少人为设计的繁杂性和人力资源消耗,同时在计算资源限定的情况下,能实现较高的分类准确率,保证了图像分类方法的稳定性和实用性。

    基于多尺度结构化字典学习的3D点云压缩系统

    公开(公告)号:CN112184840A

    公开(公告)日:2021-01-05

    申请号:CN202011002405.0

    申请日:2020-09-22

    Abstract: 本发明提供了一种基于多尺度结构化字典学习的3D点云压缩系统,其中:点云数据划分模块输出点云划分后的体素集合、不同尺度的体素块集合;几何信息编码模块输出编码的几何信息比特流;几何信息解码模块输出解码的几何信息;属性信号编码模块输出稀疏编码的系数矩阵与学习的多尺度结构化字典;属性信号编码模块输出学习到的多尺度结构化字典,属性信号压缩模块输出压缩后的属性信号比特流,属性信号解码模块输出解码的属性信号,3D点云重建模块完成重建。本发明适用于点云信号无损几何与有损属性压缩,利用点云信号天然的层次划分结构,沿着信号尺度由粗到精的方向,渐层地提升高频细节信息的重建质量,能够获得显著的性能增益。

    多用户360度视频流服务器端码率自适应传输方法及系统

    公开(公告)号:CN110248212A

    公开(公告)日:2019-09-17

    申请号:CN201910445463.1

    申请日:2019-05-27

    Abstract: 本发明提供了一种多用户360度视频流服务器端码率自适应传输方法,在用户端处,将各用户端的网络条件和用户观看信息实时反馈给服务器,并从服务器上下载分配给当前用户的视频流版本;在服务器端处,根据用户端上传的用户观看信息实时预测用户的观看视点变化,同时进行视频帧空间切片可视概率计算,通过用户的实时观看视点计算出每一个空间切片被该用户观看的概率;随后,结合用户的网络条件和空间切片被用户观看的概率,为每一个用户分配合适的视频流码率版本。同时提供了一种多用户360度视频流服务器端码率自适应传输系统。本发明提高了360度视频流传输的带宽利用率,为用户提供更好的视频服务质量。

    分布式视频信源数据采集的优化传输方法

    公开(公告)号:CN102223674A

    公开(公告)日:2011-10-19

    申请号:CN201110099398.5

    申请日:2011-04-20

    Inventor: 熊红凯 李成林

    CPC classification number: Y02D70/00

    Abstract: 一种数据通信技术领域的分布式视频信源数据采集的优化传输方法,针对多视几何分布下相邻节点间采集到视频的空间相关性,在传感器节点处采用分布式多视视频编码,为实现无线视频传感器网络的生存时间与用户接收到整体视频质量之间的最优平衡,提供一种完全分布式的速率分配算法,有效地利用了网络的带宽资源,并且通过多路径路由选择以及网络编码的引入,不仅提高了网络整体吞吐量,同时也降低了网络的传输功耗。

    一种通信网络拓扑规划问题生成式求解方法和系统

    公开(公告)号:CN119324887A

    公开(公告)日:2025-01-17

    申请号:CN202411419583.1

    申请日:2024-10-12

    Abstract: 本发明提供一种通信网络拓扑规划问题生成式求解方法和系统,包括:将网络规划问题实例参数建模为网络规划图信号X;并建立网络拓扑解#imgabs0#与图邻接矩阵之间的转换关系;将获得的网络规划信号X输入到基于图扩散生成模型的通信网络规划问题求解器,结合所述转换关系,获得网络规划问题的最优解C★。本发明是一种新型的生成式采样求解方案,能以低计算复杂度一次获取多个高质量网络拓扑可行解,有效提升网络规划问题求解效率。

    多模态人脸防伪模型训练方法、系统及人脸防伪检测方法

    公开(公告)号:CN119049137A

    公开(公告)日:2024-11-29

    申请号:CN202411175698.0

    申请日:2024-08-26

    Abstract: 本发明提供多模态人脸防伪模型训练方法、系统及人脸防伪检测方法,包括:获取多模态人脸图像训练集;对每个人脸图像样本随机丢弃模态模拟模态缺失的场景,根据训练困难程度,确定对不同缺失模态场景的丢弃策略以及进行批次级别和样本级别的随机模态丢弃;基于多模态人脸图像的模态缺失场景和批次级别和样本级别的随机丢弃,确定正负样本;构建多模态人脸防伪模型,采用缺失模态场景下的多模态人脸图像以及正负样本作为输入,得到人脸防伪结果,利用正负样本进行对比训练,确定多模态人脸防伪网络模型。本发明能够针对自然光、红外和深度相机等设备采集的不同模态或模态组合的图像,适应不同伪造人脸方式,具备低成本、高精度、高鲁棒性的特点。

    上下文增强的图像生成方法、模型训练方法及系统

    公开(公告)号:CN119048393A

    公开(公告)日:2024-11-29

    申请号:CN202411173829.1

    申请日:2024-08-26

    Abstract: 本发明提供一种上下文增强的图像生成方法、模型训练方法及系统,包括:获取训练图像数据集;利用预设的加噪机制对训练图像进行多步加噪,每一步所加的高斯噪声的方差取决于当前步数并逐渐增大,直至将未加噪的训练图像转换为标准高斯噪声,得到各步的加噪图像;利用随机掩码机制生成掩码,并根据掩码对加噪图像进行掩码区域的丢弃和对未加噪图像进行未掩码区域的丢弃;基于采用未丢弃的加噪图像和未加噪图像重建丢弃区域,对上下文增强的图像生成模型进行训练,得到训练好的图像生成模型。本发明能有效提升图像生成方法的上下文理解能力,提高图像生成质量,实现高分辨率多样性的图像生成。

Patent Agency Ranking