一种面向长尾分布的视觉-语言模型提示学习框架

    公开(公告)号:CN118917276A

    公开(公告)日:2024-11-08

    申请号:CN202410270687.4

    申请日:2024-03-11

    Applicant: 东南大学

    Inventor: 方鹏飞 李文倩

    Abstract: 本发明公开了一种面向长尾分布的视觉‑语言模型提示学习框架,首先使用类特定或者类通用的提示分布生成器生成一个提示分布,然后从该分布采样一定数量的提示,和类别文本一起输入至文本编码器得到文本编码向量。随后将图片输入到图像编码器得到图像编码向量,利用对比损失指导文本编码向量和图像编码向量的在语义对齐上的训练。通过将提示的学习形式化为一个变分问题,该框架能够同时生成多个提示来描述类别,从而建立了一个强大的集成学习算法,使得模型能够充分学习训练样本数量稀缺的尾部类别。实证研究表明,所提出的提示学习框架有助于将预训练的视觉‑语言模型成功应用于数据长尾分布的下游视觉识别任务中。

    一种具有极化转换和波束偏折功能的编码超表面

    公开(公告)号:CN114843794A

    公开(公告)日:2022-08-02

    申请号:CN202210510538.1

    申请日:2022-05-11

    Applicant: 东南大学

    Abstract: 本发明公开了一种具有极化转换和波束偏折功能的编码超表面,该超表面由若干个超表面单元按照一定的编码排列构成;其中,超表面单元由上至下依次包括金属贴片层(1)、介质基板(2)和金属地(3)。超表面单元金属贴片层(1)具有沿x方向和y方向的正交结构,便于对x极化和y极化电磁波反射相位进行独立控制,进而实现极化转换功能。超表面单元采用2‑bit编码,相邻bit单元反射相位相差90°,在58.7~61.2GHz的频率范围内实现了对反射波的有效调控。基于上述单元设计了超表面阵列,实现了反射波束向θ=30°,φ=210°方向的偏折,主瓣轴比在56~61GHz频率范围内小于3dB。

Patent Agency Ranking