-
公开(公告)号:CN117793610A
公开(公告)日:2024-03-29
申请号:CN202311855774.8
申请日:2023-12-29
Applicant: 广西广播电视信息网络股份有限公司 , 桂林电子科技大学
Abstract: 本发明公开了一种基于神经辐射场的声线追踪声场还原方法。本发明采用“声线追踪”模型,考虑了声波的直接传播和在各种表面上的多次反射。为了简化这个模型,本发明使用类似于神经辐射场(NeRF)的理念来建模声音,通过神经渲染的方式还原空间中不同位置和角度所接受到固定声源发出的声音。本发明利用神经辐射场(NeRF)和声场数据相结合的方法,在三维空间中模拟声音的直接传播和多次反射,以实现在特定听点和特定方向的声音强度的精确计算。
-
公开(公告)号:CN117793610B
公开(公告)日:2024-11-29
申请号:CN202311855774.8
申请日:2023-12-29
Applicant: 广西广播电视信息网络股份有限公司 , 桂林电子科技大学
Abstract: 本发明公开了一种基于神经辐射场的声线追踪声场还原方法。本发明采用“声线追踪”模型,考虑了声波的直接传播和在各种表面上的多次反射。为了简化这个模型,本发明使用类似于神经辐射场(NeRF)的理念来建模声音,通过神经渲染的方式还原空间中不同位置和角度所接受到固定声源发出的声音。本发明利用神经辐射场(NeRF)和声场数据相结合的方法,在三维空间中模拟声音的直接传播和多次反射,以实现在特定听点和特定方向的声音强度的精确计算。
-
公开(公告)号:CN118840774A
公开(公告)日:2024-10-25
申请号:CN202410885840.4
申请日:2024-07-03
Applicant: 广西广播电视信息网络股份有限公司 , 桂林电子科技大学
Abstract: 本发明属于神经网络技术领域,提供了一种快速反应且高准确率的六种情感识别的方法和系统。本发明首先通过轻量级端到端的深度学习模型进行面部检测以确保快速准确的定位能力;然后利用VGG16模型对检测到的面部图像进行表情分类,以提取丰富的特征信息。通过微调端到端的深度学习模型和采用VGG16模型的迁移学习,系统在标准面部表情数据集上取得满意的性能,实现了高准确率和实时性。通过结合端到端的深度学习模型和VGG模型的优势,本发明实现了对人类面部表情进行快速检测和准确分类,提高了面部表情识别的准确性和实时性,增强了系统的泛化能力和处理复杂情感变化的能力。
-
公开(公告)号:CN109218827A
公开(公告)日:2019-01-15
申请号:CN201710532887.2
申请日:2017-07-03
Applicant: 北京市博汇科技股份有限公司 , 广西广播电视信息网络股份有限公司
Inventor: 裴丹丹 , 徐洪亮 , 乐晋德 , 朴根华 , 杨京 , 赵泽发 , 高晓娜 , 张家斌 , 杨波 , 黄广宇 , 黄勇林 , 朱克俊 , 张蔚之 , 刘至洋 , 刘爱娟 , 漆鸿波 , 卢东 , 唐剑 , 韦坚 , 丘君良 , 赖东民 , 廖维梅 , 张坤
IPC: H04N21/442 , H04N21/4402 , H04N21/438 , H04N21/426 , H04N21/45
Abstract: 本发明实施例公开了一种IP码流切换方法及设备,所述方法包括,当接收到至少两路IP码流时,统计所述至少两路IP码流中每一路IP码流对应的包标识符PID带宽;分别检测每一个所述PID带宽是否位于其相应目标阈值范围内;从所述PID带宽位于所述目标阈值范围的IP码流中确定输出码流。本发明实施例的技术方案,以IP码流对应的PID带宽为参数,检测IP码流是否异常,能够检测出的异常类型更多,从而能够提高检测精度。此外,通过增设DSP模块,并且通过FPGA模块和DSP模块相互配合,还能够实现IP码流的自动切换,从而能够使得IP码流切换更加智能化,进而提高用户的使用体验。
-
-
-