-
公开(公告)号:CN116992344A
公开(公告)日:2023-11-03
申请号:CN202310971970.5
申请日:2023-08-03
Applicant: 维智脑数据服务(天津)有限公司 , 清华大学
IPC: G06F18/241 , G06F18/214 , G06F18/25 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本公开涉及机器学习技术领域,具体涉及一种证据深度学习模型的双层证据融合学习方法和装置、分类评估方法及装置。方法包括:获取包括多个样本对象的训练数据的多模态数据集,每个样本对象对应于多种模态的多个训练数据;针对所述多模态数据集使用证据深度学习模型,针对每个样本对象采用双层证据融合策略,获得所述样本对象的分类信度结果和分类不确定度结果;根据多个样本对象中每个样本对象的分类信度结果和真实类别标签,构造狄利克雷分布下的损失函数,对证据深度学习模型的模型参数进行调整,获得优化后的双层证据融合的证据深度学习模型。本公开综合考虑了模型泛化性和对不确定度的估计能力,提高了数据分类的准确性和置信度。
-
公开(公告)号:CN101202043B
公开(公告)日:2011-06-15
申请号:CN200710304486.8
申请日:2007-12-28
Applicant: 清华大学
Abstract: 本发明公开了一种音频信号的编码方法和装置与解码方法和装置,属于多媒体信号处理和信源编码领域。编码方法包括:对左右声道的音频信号以极大相关度旋转角为旋转角进行正交旋转变换;对经过正交旋转变换的左右声道的音频信号进行编码。解码方法包括:对接收到的码流数据进行解码输出经过解码的音频信号;对经过解码的音频信号以极大相关度旋转角为旋转角进行正交逆旋转变换。编码装置包括:极大相关度旋转变换模块和编码模块。解码装置包括:解码模块和极大相关度逆旋转变换模块。本发明通过少量的极大相关度旋转角参数记录立体声信息,可以用很低的码率实现立体声音频信号的高保真压缩。
-
公开(公告)号:CN101141644B
公开(公告)日:2010-12-08
申请号:CN200710175993.6
申请日:2007-10-17
Applicant: 清华大学
Abstract: 本发明公开了一种编码集成系统和方法与解码集成系统和方法,属于多媒体信号处理和信源编码领域。编码集成系统包括接收模块、提取模块、分类模块、子编码器、控制模块、合并模块和封装及传输模块;解码集成系统包括接收及解封装模块、解析模块、分配模块、子解码器、控制模块和缓存输出模块。编码集成方法包括:从多媒体信号中提取相关性信息并得到一路主信号;对主信号或多媒体信号进行分类;子编码器对主信号进行编码后与各种参数合并、封装后传输。解码集成方法包括:接收码流数据,解封装和解析后解码得到主信号,输出主信号或处理后的主信号。本发明能充分发挥各种个性化多媒体编码器的优势,满足主观感觉特性及不同信道需求。
-
公开(公告)号:CN1405670A
公开(公告)日:2003-03-26
申请号:CN02148653.0
申请日:2002-11-15
Applicant: 清华大学
Abstract: 多格式数字音频播放器及其算法加载、升级和添加的方法,涉及到电声技术领域,尤其涉及到多格式数字音频处理技术领域。其特征在于,该播放器含有节目数据和节目算法共用的节目存储器,及与该节目存储器依次互连的控制器和数字信号处理器。根据该播放器的结构特点,本发明还设计了其算法加载、升级和添加的方法。本发明取消了价格昂贵的算法存储器,合理利用存储器资源,使用户能够方便灵活地运用播放器,同时减少了印制板的尺寸,降低了播放器的功耗,使播放器的成本得到降低。
-
公开(公告)号:CN116992344B
公开(公告)日:2025-02-14
申请号:CN202310971970.5
申请日:2023-08-03
Applicant: 维智脑数据服务(天津)有限公司 , 清华大学
IPC: G06F18/241 , G06F18/214 , G06F18/25 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本公开涉及机器学习技术领域,具体涉及一种证据深度学习模型的双层证据融合学习方法和装置、分类评估方法及装置。方法包括:获取包括多个样本对象的训练数据的多模态数据集,每个样本对象对应于多种模态的多个训练数据;针对所述多模态数据集使用证据深度学习模型,针对每个样本对象采用双层证据融合策略,获得所述样本对象的分类信度结果和分类不确定度结果;根据多个样本对象中每个样本对象的分类信度结果和真实类别标签,构造狄利克雷分布下的损失函数,对证据深度学习模型的模型参数进行调整,获得优化后的双层证据融合的证据深度学习模型。本公开综合考虑了模型泛化性和对不确定度的估计能力,提高了数据分类的准确性和置信度。
-
公开(公告)号:CN115471648A
公开(公告)日:2022-12-13
申请号:CN202110566021.X
申请日:2021-05-24
Applicant: 维智脑数据服务(天津)有限公司 , 清华大学
IPC: G06V10/25 , G06V10/764
Abstract: 本公开某些实施例公开了一种差异成分识别方法、装置、电子设备及可读存储介质。该差异成分识别方法,包括:获取两组有向脑网络数据;处理所述两组有向脑网络数据,以确定一个或多个具有显著差异的候选连通成分;通过对所述两组有向脑网络数据进行置换检验,从所述候选连通成分中识别差异成分。该技术方案避免了大规模统计检验所面临的多重检验矫正效力下降问题,提高了统计效力,可实现有向脑网络连接差异成分识别。
-
公开(公告)号:CN115169067A
公开(公告)日:2022-10-11
申请号:CN202110359522.0
申请日:2021-04-02
Applicant: 维智脑数据服务(天津)有限公司 , 清华大学
Abstract: 本公开某些实施例公开了一种脑网络模型构建方法、装置、电子设备及可读存储介质。该脑网络模型构建方法包括:获取大脑的功能神经数据,确定所述功能神经数据中的节点;基于收敛交叉映射或延时收敛交叉映射构建各节点之间的有向连接;基于所述节点和所述有向连接构建脑网络模型。该技术方案利用收敛交叉映射或延时收敛交叉映射对人脑网络进行建模,确定各个大脑区域之间的信息流动方向,提高了脑网络模型的准确性。
-
公开(公告)号:CN102623007B
公开(公告)日:2014-01-01
申请号:CN201110033410.2
申请日:2011-01-30
Applicant: 清华大学
Abstract: 本发明公开了多媒体信号处理和模式识别技术领域中的一种基于可变时长的音频特征分类方法。包括将确定类型并经过标注的音频序列作为训练序列;提取训练序列中的音频信号的短时特征构成短时特征向量;计算各个短时特征在设定时长内的统计参量,进而得到短时特征向量对应的统计特征向量;计算得到短时特征向量对应的一组统计特征向量,由该组统计特征向量构成训练序列的长时特征向量;利用训练序列的长时特征向量训练分类器;提取测试序列中第i帧的音频信号的短时特征并计算测试序列的第i帧的输入长时特征向量;将第i帧的输入长时特征向量送入训练后的分类器中,得到分类类型。本发明避免提取长时特征导致的延时问题,实现了音频特征的实时分类。
-
公开(公告)号:CN101695150A
公开(公告)日:2010-04-14
申请号:CN200910235713.5
申请日:2009-10-12
Applicant: 清华大学
IPC: H04S3/00
Abstract: 本发明公开了一种多声道音频编码方法、编码器、解码方法和解码器,属于音频处理技术领域。该编码方法包括:根据主声道信号对环绕声道信号进行线性预测,得到预测参数,将预测参数加入编码码流;或,根据主声道信号和传输函数对环绕声道信号进行预测,得到预测参数,将预测参数加入编码码流;判别环绕声道信号与中央声道信号之间是否具有相关性,或判别环绕声道信号与左、右主声道信号之间是否具有相关性,如果是,则对预测参数、主声道信号和相关性判别信息进行编码。还公开了一种多声道音频编码器、解码方法和解码器。本发明提高了编解码性能,能在解码端自适应地改变输出的重放声道。
-
公开(公告)号:CN101661749A
公开(公告)日:2010-03-03
申请号:CN200910093060.1
申请日:2009-09-23
Applicant: 清华大学
IPC: G10L19/14
Abstract: 本发明实施例提供了一种语音和音乐双模切换编/解码的方法,其特征在于,所述编码方法包括:判断输入的音频信号的类型是否发生了切换;当从音乐信号切换为语音信号时,则获取切换前的音乐信号的尾部信号,采用语音编码模式进行预编码,将切换后的语音信号采用语音编码模式进行编码;当输入的音频信号从语音信号切换为音乐信号时,则获取切换前的所述语音信号的尾部信号,采用音乐编码模式进行预编码,将切换后的音乐信号采用音乐编码模式进行编码。本发明实施例在音频信号发生切换时,通过采用预编码和预解码的方式,使得音乐信号与语音信号切换时,编码能够较平稳地过渡;在解码时也能保证音乐信号与语音信号的无失真切换。
-
-
-
-
-
-
-
-
-