一种基于视听融合效应的音视频跨模态搜索方法

    公开(公告)号:CN116778291A

    公开(公告)日:2023-09-19

    申请号:CN202310742204.1

    申请日:2023-06-21

    Applicant: 南京大学

    Abstract: 一种基于视听融合效应的音视频跨模态搜索方法,对于用户给出的音频或视频,本发明可以通过训练好的人工智能网络,进行跨模态的搜索,即通过音频搜索视频或通过视频搜索音频。对于输入的其进行情感特征的提取,并以特征向量的余弦距离在素材库中进行搜索。本发明可以适配目前常见音视频格式的要求,内容上视频适用场景包括电影、纪录片、广告片等,音频适用场景包括古典乐、流行乐、爵士乐等。

    一种声波导
    2.
    发明公开

    公开(公告)号:CN106454648A

    公开(公告)日:2017-02-22

    申请号:CN201610562879.8

    申请日:2016-07-15

    Applicant: 南京大学

    CPC classification number: H04R9/06 H04R9/02 H04R2400/11

    Abstract: 一种声波导,声波导的内部声波导管包括二叉树或三叉树的多级分叉结构波导管,每级分叉结构的波导管包括直管和转角导管;声波导管的横截面为矩形、圆、椭圆或多边形,分叉结构的波导管横截面面积必须足够小,横截面最大维度的尺寸一般不超过2cm;分叉结构的波导管的直管部分应足够长,一般长度不小于3cm;对于出口宽度较大的声波导,分叉结构的波导管在出口处采用分层结构,分层数目视出口宽度和波导管横截面形状而定,每层宽度控制在2cm以内。

    一种声波导
    4.
    发明授权

    公开(公告)号:CN106454648B

    公开(公告)日:2019-07-02

    申请号:CN201610562879.8

    申请日:2016-07-15

    Applicant: 南京大学

    Abstract: 一种声波导,声波导的内部声波导管包括二叉树或三叉树的多级分叉结构波导管,每级分叉结构的波导管包括直管和转角导管;声波导管的横截面为矩形、圆、椭圆或多边形,分叉结构的波导管横截面面积必须足够小,横截面最大维度的尺寸一般不超过2cm;分叉结构的波导管的直管部分应足够长,一般长度不小于3cm;对于出口宽度较大的声波导,分叉结构的波导管在出口处采用分层结构,分层数目视出口宽度和波导管横截面形状而定,每层宽度控制在2cm以内。

Patent Agency Ranking