-
公开(公告)号:CN118397997A
公开(公告)日:2024-07-26
申请号:CN202410614987.X
申请日:2024-05-17
Applicant: 南京大学 , 新型显示与视觉感知石城实验室
Abstract: 本发明公开了一种用于声场调控的二值化声超表面系统及其迭代优化方法,所述二值化声超表面系统通过是否安装喉塞改变单元上的声波反射相位,实现声场调控,形成安静区或高声强区;所述迭代优化方法通过对类亥姆霍兹单元逐一进行二元相位优化迭代,能够实现对室内声场的高效、灵活控制,包括但不限于创造室内安静区和高声强区域;在保证声场控制效果的同时极大地减小了计算的时间复杂度。本发明属于无源调控不消耗额外能量,将二值化声超表面与简单的优化迭代算法结合,能够实现更灵活的声场控制应用。
-
公开(公告)号:CN119887520A
公开(公告)日:2025-04-25
申请号:CN202411724468.5
申请日:2024-11-28
Applicant: 南京大学 , 中移(苏州)软件技术有限公司 , 中国移动通信集团江苏有限公司 , 中国移动通信集团有限公司
IPC: G06T3/4053 , G06T3/4046 , G06F18/213 , G06V10/774 , G06N5/04
Abstract: 一种高分辨率多模态大模型架构的实现方法,实现一种多模态大模型架构,配置用于已有的多模态大模型,用于处理包含高分辨率图像的输入,所述多模态大模型架构对视觉特征提取部分引入局部随机采样机制,并采用分层注入机制将多次随机采样的结果分层注入LLM中。本发明将多次局部随机采样得到的视觉特征划分到LLM的不同层注入,显著减少了LLM在每一层中需要处理的视觉特征,在保证MLLM模型性能前提下,节省了模型训练和推理时的时间开销和显存开销,本发明的局部随机采样机制去除了大量的冗余视觉特征,提高了LLM模型的性能,解决了模型输入高分辨率图像时导致性能下降的问题。
-