-
公开(公告)号:CN116778291A
公开(公告)日:2023-09-19
申请号:CN202310742204.1
申请日:2023-06-21
Applicant: 南京大学
IPC: G06V10/80 , G06V10/774 , G06V20/40 , G10L25/63
Abstract: 一种基于视听融合效应的音视频跨模态搜索方法,对于用户给出的音频或视频,本发明可以通过训练好的人工智能网络,进行跨模态的搜索,即通过音频搜索视频或通过视频搜索音频。对于输入的其进行情感特征的提取,并以特征向量的余弦距离在素材库中进行搜索。本发明可以适配目前常见音视频格式的要求,内容上视频适用场景包括电影、纪录片、广告片等,音频适用场景包括古典乐、流行乐、爵士乐等。
-
公开(公告)号:CN106454648A
公开(公告)日:2017-02-22
申请号:CN201610562879.8
申请日:2016-07-15
Applicant: 南京大学
CPC classification number: H04R9/06 , H04R9/02 , H04R2400/11
Abstract: 一种声波导,声波导的内部声波导管包括二叉树或三叉树的多级分叉结构波导管,每级分叉结构的波导管包括直管和转角导管;声波导管的横截面为矩形、圆、椭圆或多边形,分叉结构的波导管横截面面积必须足够小,横截面最大维度的尺寸一般不超过2cm;分叉结构的波导管的直管部分应足够长,一般长度不小于3cm;对于出口宽度较大的声波导,分叉结构的波导管在出口处采用分层结构,分层数目视出口宽度和波导管横截面形状而定,每层宽度控制在2cm以内。
-
公开(公告)号:CN116740450A
公开(公告)日:2023-09-12
申请号:CN202310726324.2
申请日:2023-06-19
Applicant: 南京大学
IPC: G06V10/764 , G06V10/77 , G06V10/40 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/045 , G06N3/084 , G06N3/096
Abstract: 一种基于联邦迁移学习的音视频匹配方法及系统,本发明所述方法基于大量情感数据,训练出预训练模型,个人用户在预训练模型上基于联邦迁移学习,使用少量个人数据,即可获得适用于自己需求的音视频匹配模型。本发明训练过程中数据隔离,解决了音视频匹配中可能存在的数据泄露风险,保障了用户的版权和隐私。同时保证了模型的质量无损传输,不会出现负迁移。
-
公开(公告)号:CN106454648B
公开(公告)日:2019-07-02
申请号:CN201610562879.8
申请日:2016-07-15
Applicant: 南京大学
Abstract: 一种声波导,声波导的内部声波导管包括二叉树或三叉树的多级分叉结构波导管,每级分叉结构的波导管包括直管和转角导管;声波导管的横截面为矩形、圆、椭圆或多边形,分叉结构的波导管横截面面积必须足够小,横截面最大维度的尺寸一般不超过2cm;分叉结构的波导管的直管部分应足够长,一般长度不小于3cm;对于出口宽度较大的声波导,分叉结构的波导管在出口处采用分层结构,分层数目视出口宽度和波导管横截面形状而定,每层宽度控制在2cm以内。
-
-
-