-
公开(公告)号:CN119849595A
公开(公告)日:2025-04-18
申请号:CN202411700408.X
申请日:2024-11-26
Applicant: 浙江大学
IPC: G06N3/098 , G06N3/0455 , G06N5/04 , G06N5/025
Abstract: 本发明公开了一种面向视觉生成式反绎学习的元规则选择策略学习方法。视觉生成式反绎学习是联合训练基于符号的神经视觉生成器和从数据中归纳逻辑规则,实现由逻辑规则引导的视觉生成过程。针对其逻辑符号集较大、规则复杂导致的反绎时间成本高的问题,本发明提出了一种预训练方法,旨在为反绎学习方法获取元规则选择策略,从而减少候选元规则集并优化搜索空间。该选择模型通过对案例中的符号和元规则的标记化,可以有效地与视觉生成式反绎学习中的神经模型和逻辑推理系统相结合。预训练仅在符号数据上进行,不涉及原始视觉输入的符号接地学习。本发明具有学习成本低、提升视觉生成式反绎学习效率、适用于复杂逻辑规则学习和视觉生成任务等特点。
-
公开(公告)号:CN118519743A
公开(公告)日:2024-08-20
申请号:CN202410679371.0
申请日:2024-05-29
Applicant: 浙江大学
Abstract: 本发明公开了一种基于GPU的OpenMP规约指令的实现方法,该方法是基于GPU的OpenMP规约相关指令、子句(如reduction子句、declare_reduction指令等)的实现方法。它既满足了OpenMP 5.0标准对于规约相关指令以及子句的规定,又通过C++模板以及函数重载等使得本方法无需显示解析变量类型,使本方法更加轻量化与通用。同时,本方法采用多级规约的思路,尽力保证用户代码在翻译后依然保持高效。本方法的主要用途在于它可以以轻量化,低耦合的方式实现现有GPU编译器对OpenMP的规约相关指令、子句的扩展支持,同时保证与目标GPU架构的较强的兼容性。
-
公开(公告)号:CN114240811B
公开(公告)日:2024-07-26
申请号:CN202111430792.2
申请日:2021-11-29
Applicant: 浙江大学
Abstract: 本发明公开一种基于多张图像生成新图像的方法,该方法将多张输入图像分别输入训练后的图像特征提取网络,提取每个输入图像的多尺度特征;将输入图像、输入图像的姿态和目标姿态输入训练后的变换特征提取网络,提取每个输入图像多尺度下的初始变换、遮挡图和注意力图;将目标姿态输入训练后的目标合成网络,所述目标合成网络包括编码器和解码器,且在解码器的不同层级,加入残差模块和融合模块;目标合成网络预测每个输入图像特征在不同尺度下的残差变换来改善匹配目标姿态,然后对变换后的特征进行融合以得到目标特征,最终通过解码器解码目标特征得到生成的目标图像。本发明的方法可以适用于多种类型的图像数据,能够尽可能地保留图像细节。
-
公开(公告)号:CN116977520A
公开(公告)日:2023-10-31
申请号:CN202310583316.7
申请日:2023-05-23
Applicant: 浙江大学 , 杭州相芯科技有限公司
IPC: G06T15/00 , G06T15/50 , G06T15/04 , G06N3/0464
Abstract: 本发明公开了一种人脸漫反射与镜面反射材质重建方法,以研究提高可微分渲染下求解人脸漫反射与镜面反射材质效率的方法。该发明引入了近年来对于人脸材质重建相关的研究方法,将现有的基于路径追踪流程下的可微分渲染流程,修改为基于预计算的可微分渲染流程。在基于预计算可微分渲染求解镜面反射材质的基础上,增加了神经网络作为拆分求和预计算方法与路径追踪计算之间存在误差的补偿,使得求解的人脸镜面反射材质的结果更加接近真实值。实验结果表明,该方法能够重建出可用高质量的人脸漫反射和镜面反射材质,相对于基于路径追踪的可微分渲染求解结果,具有更少的噪声、更多的细节,性能上有显著的提升。
-
公开(公告)号:CN116596738A
公开(公告)日:2023-08-15
申请号:CN202310424566.6
申请日:2023-04-20
Applicant: 浙江大学 , 芯原微电子(上海)股份有限公司
Inventor: 周昆
Abstract: 本发明公开了一种Vulkan光线追踪流水线转化为计算流水线的方法。该方法基于光线追踪是易并行性问题的本质进行设计。本发明通过劫持Vulkan原生驱动以及着色器中的指令,将光线追踪扩展相关的所有API替换为自行实现版本。本发明在SPIR‑V层面对用户提供的着色器进行解析,通过将所有着色器合并的方式使得用户提供的着色器能够加载到计算流水线中,使用递归展开的方式解决不同着色器相互调用的问题,使用一系列自定义类型替换RTX扩展中的不透明类型,使用一系列自定义函数替换RTX扩展中的光线追踪指令。本发明成功解决了集成显卡和边缘计算设备不能运行Vulkan RTX软件或需重复编码的问题,应用空间巨大,具有较高普适性。
-
公开(公告)号:CN116563468A
公开(公告)日:2023-08-08
申请号:CN202310598391.0
申请日:2023-05-24
Applicant: 浙江大学 , 上海天华建筑设计有限公司
Abstract: 本发明属于计算机图形技术领域,具体公开了一种在三维建筑物中检测构件的碰撞关系的方法。包括:为所述三维建筑物构造层次包围盒树,并且使用一维数组来保存所述层次包围盒树中的所有节点,其中,同一父节点下的子节点保存为连续的数组元素。本发明的优点在于提高了遍历层次包围盒树的速度。
-
公开(公告)号:CN116524161A
公开(公告)日:2023-08-01
申请号:CN202310244038.2
申请日:2023-03-15
Applicant: 浙江大学 , 杭州相芯科技有限公司
Abstract: 本发明公开了一种保设计语义的多层服装迁移方法,该方法是利用“服装上的大多数点难以获得与人体骨骼点的对应关系,但是求解连续的区域时可以使用部分可以和骨骼对应的点作为约束进行优化,从而的得到无骨骼对应关系点”的规律,提出了先对有骨骼点对应的服装点计算迁移后的位置,再利用原始服装模型的连续性使用biharmonic插值得到无骨骼对应关系点迁移后位置的初值,再利用“保持服装设计要求服装三角形网格的法线在迁移前后不变”和“保持服装形状要求服装点在迁移前后和身体点的相对位置不变”的性质分别构建能量。本发明解决了单件服装中的多层间相对位置以及人体和服装间穿模以及在身材不同的人体间的服装迁移时形状特征保持难的问题。
-
公开(公告)号:CN112989566B
公开(公告)日:2022-11-11
申请号:CN202110162275.5
申请日:2021-02-05
Applicant: 浙江大学
Abstract: 本发明公开了一套自适应的基于几何声学的声音传播仿真方法,该方法能够基于A‑加权方差指标动态调节所需的采样数,以减少冗余的运算量,提升运算效率,提高生成的声音传播仿真效果质量。该方法主要包括如下步骤:1)输入:获取需要进行传播的原始音频和虚拟场景;2)采样数估算:使用测试射线计算单个采样的A‑加权方差,并估算实际需要的采样数量;3)传播:使用上述估算的采样数进行虚拟场景的冲激响应计算;4)输出:得到人耳可听或可用于后续分析的,传播后的音频结果。本发明可以和普遍使用的各类几何声学声音传播仿真框架结合,运用在虚拟现实、建筑声学等领域中,适用于各种不同的声音传播场景、原始音频、采样方式,具有较高普适性和稳定性。
-
公开(公告)号:CN111652960B
公开(公告)日:2022-07-15
申请号:CN202010377197.6
申请日:2020-05-07
Applicant: 浙江大学 , 杭州相芯科技有限公司
Abstract: 本发明公开了一种基于可微渲染器的从单幅图像求解人脸反射材质的方法。该方法主要分为五个步骤:图像中人脸3D几何信息的计算、人脸反射隐空间与球谐光照的初始化、人脸反射隐空间到人脸反射材质图像的解码、人脸反射材质的质量提升、迭代优化人脸反射材质的隐空间系数和球谐光照系数并根据反射材质隐空间系数求解人脸反射材质。本发明可以根据一张正面中性表情的人脸图片迭代求解高质量人脸材质,利用得到的材质进行人脸重建以及再渲染的结果均达到当前最先进技术的水平。本发明可以应用在一系列应用中,如人脸材质的捕捉,人脸的重建,以及真实人脸渲染等应用。
-
公开(公告)号:CN112929622B
公开(公告)日:2022-04-12
申请号:CN202110162958.0
申请日:2021-02-05
Applicant: 浙江大学
IPC: H04N9/64
Abstract: 本发明公开了一种基于深度学习的欧拉视频颜色放大方法,包括获得颜色放大网络和调用颜色放大网络两个步骤。首先合成一个模拟微小颜色变化图片数据集,并在该数据集上训练一个由空间分解、差分滤波、放大处理、图像重建四个模块构建的颜色放大网络;在运行时,对FIR带通滤波器进行优化,并将其替换网络的差分滤波模块。步骤二根据给定输入视频进行颜色放大处理时,先将视频分解为帧序列,通过调用颜色放大网络生成颜色放大帧序列,最后合成颜色放大视频。相比线性放大方法,本发明方法步骤一采用深度学习模型,训练过程自动化,免去了繁琐的人工设计;步骤二的处理,大大减少了噪声,在动态场景下不会产生伪影,增强了放大效果。
-
-
-
-
-
-
-
-
-