面向安检领域的多模态大模型检索方法和装置

    公开(公告)号:CN119719397A

    公开(公告)日:2025-03-28

    申请号:CN202411855183.5

    申请日:2024-12-16

    Abstract: 本公开提供了一种面向安检领域的多模态大模型检索方法、装置、电子设备、存储介质和程序产品。该方法包括:接收包括目标文本和目标图像的用户输入,以及按照检索增强流程处理用户输入。其中,先在安检数据库中检索目标图像中待识别的第一图像块,得到第一检索结果,该第一检索结果包括至少一个第一安检图像和第一安检图像中与第一图像块匹配成功的图像块的第一文本记录数据;然后利用第一提示词提示大模型根据第一检索结果中的第一文本记录数据确定出第一图像块中的货物种类,以得到第一货物识别结果;接着利用预设的第二提示词提示大模型结合第一货物识别结果,生成针对目标文本的第一答复内容。

    基于语义的透视图像检索方法及其装置

    公开(公告)号:CN113407753A

    公开(公告)日:2021-09-17

    申请号:CN202010184164.X

    申请日:2020-03-16

    Abstract: 本申请提供了基于语义的透视图像检索方法、基于语义的透视图像检索装置、电子设备、以及计算机可读介质,所述方法包括:由透视图获取装置获得针对其中包括被查验对象的空间的透视图像;利用第一方法对透视图像进行语义划分,以获得多个语义区域单元;利用第二方法构建特征提取网络;基于透视图像及其多个语义区域单元中的每个语义区域单元,利用特征提取网络提取针对每个语义区域单元的特征;以及基于针对每个语义区域单元的特征,从图像特征库中检索与该语义区域单元最相似的图像,以用于辅助确定该语义区域单元中的被查验对象。

Patent Agency Ranking