-
公开(公告)号:CN111553165B
公开(公告)日:2022-03-18
申请号:CN202010178749.0
申请日:2020-03-15
Applicant: 北京理工大学 , 贵州嗨球大数据产业发展有限公司
IPC: G06F40/30 , G06F40/289 , G06N3/04
Abstract: 本发明涉及一种基于情感计算的足球运动员比赛表现评估方法,属于人工智能机器学习技术领域。本方法,利用情感计算技术和文本信息抽取技术,将足球战报中涉及球员表现的表述进行结构化处理并进行量化,之后与统计数据进行结合,利用线性回归算法输出球员表现评分。本方法在输入球员技术统计的基础上,通过引入战报文本信息,利用情感计算技术,使事件的质量得以量化,从而同时兼顾技术项的数量和质量,能够更科学合理地对球员的比赛表现进行评判。
-
公开(公告)号:CN111553165A
公开(公告)日:2020-08-18
申请号:CN202010178749.0
申请日:2020-03-15
Applicant: 北京理工大学 , 贵州嗨球大数据产业发展有限公司
IPC: G06F40/30 , G06F40/289 , G06N3/04
Abstract: 本发明涉及一种基于情感计算的足球运动员比赛表现评估方法,属于人工智能机器学习技术领域。本方法,利用情感计算技术和文本信息抽取技术,将足球战报中涉及球员表现的表述进行结构化处理并进行量化,之后与统计数据进行结合,利用线性回归算法输出球员表现评分。本方法在输入球员技术统计的基础上,通过引入战报文本信息,利用情感计算技术,使事件的质量得以量化,从而同时兼顾技术项的数量和质量,能够更科学合理地对球员的比赛表现进行评判。
-
公开(公告)号:CN114510975A
公开(公告)日:2022-05-17
申请号:CN202210115522.0
申请日:2022-02-07
Applicant: 北京理工大学
Abstract: 本发明涉及一种基于两级模型的个性化头相关传输函数预测方法,属于虚拟三维音频、沉浸式音频技术领域。本发明的一种基于两级模型的个性化头相关传输函数预测方法:首先,基于已知的头相关传输函数数据库中的人体参数、头相关传输函数数据以及角度信息对决策树模型以及Transformer神经网络模型逐级进行训练,并顺序连接,得到训练好的两级模型;然后,采集待预测人员的人体参数,将人体参数作为训练好的两级模型的输入,得到该人员的个性化头相关传输函数数据,由此实现个性化头相关传输函数预测。本发明通过两级模型降低平均预测误差,提高预测结果的精度;利用开源小型数据库,简化试验测量过程;通过Transformer模型避免训练中的过拟合现象。
-
公开(公告)号:CN107358966B
公开(公告)日:2020-05-12
申请号:CN201710498188.0
申请日:2017-06-27
Applicant: 北京理工大学
Abstract: 本发明公开了基于深度学习语音增强的无参考语音质量客观评估方法,属于语音质量评价技术领域。本方法分为三个步骤:首先将待测语音经过已经训练好的基于深度信念网络的语音增强模型,得到增强后的语音信号;然后,分别提取出增强前后信号的梅尔倒谱系数,做两个系数的差;最后将这个参数作为输入,通过第二层的BP神经网络模型,映射为最终的客观分数,由此实现无参考的语音质量客观评价。与以往的无参考语音质量评价模型相比,本发明方法与主观质量评分的相关度更好,均方误差也更小。
-
公开(公告)号:CN106981292B
公开(公告)日:2020-04-14
申请号:CN201710342387.2
申请日:2017-05-16
Applicant: 北京理工大学
IPC: G10L19/008
Abstract: 本发明公开了一种基于张量建模的多路空间音频信号压缩和恢复方法,属于音频信号处理技术领域,尤其是空间音频编解码技术领域。对于多路空间音频信号进行声道能量归一化,同时获得声道能量调整参数,对每个声道的音频信号进行分帧、时频变换得到频域上的特征参数。对于训练样本集,建立四阶音频张量,经过张量分解得到三个低秩因子矩阵,其与测试样本集构建的三阶音频张量进行张量运算,得到压缩的核张量与声道能量调整参数一起编码传输,在解码端传输而来的核张量与训练好的低秩因子矩阵进行张量重构,对重构的张量信号在每个声道上进行逆变换、重叠相加和能量调整恢复出多路空间音频信号。本方法采用独特的因子矩阵的训练模式对多路空间音频信号进行张量建模能达到更高的压缩效率。
-
公开(公告)号:CN104575522B
公开(公告)日:2018-02-06
申请号:CN201510017402.7
申请日:2015-01-14
Applicant: 北京理工大学
IPC: G10L25/60
Abstract: 本发明涉及一种用于主观测听的听音人等级综合评定方法,属于电信技术领域中语音质量的主观评价方向。包括以下步骤:1、计算得到语音质量主观测听的五个听音人数据分析指标;2、采用层级分析的量化方法对上述指标进行量化处理,得到各指标的权重向量;3、建立在线主观测听实验的听音人评价备择集={“优”,“良”,“中”,“及格”,“差”};4、将听音人数据分析指标结合权重向量计算整体均方值并划分到备择集中。对比现有方法,本发明方法可以对参加网络测听实验的听音人的表现进行综合评定,从而剔除评定等级较差的听音人,提高网络测听实验的准确性和可信性。
-
-
公开(公告)号:CN101587710A
公开(公告)日:2009-11-25
申请号:CN200910088368.7
申请日:2009-07-02
Applicant: 北京理工大学
Abstract: 本发明公开了一种基于音频突发事件分类的多码本编码参数量化方法,属于音频编码技术领域。本方法首先对输入的音频信号逐帧进行暂态检测,然后对检测出的暂态帧进行突发事件分类,最后对得到的音频突发事件的编码参数,进行基于突发事件分类码本的矢量量化,由此实现了音频突发事件的分类和音频突发事件编码参数的量化过程。本发明方法提高了对突发事件编码参数的量化效果,改善了突发事件的编码音质。
-
公开(公告)号:CN100389421C
公开(公告)日:2008-05-21
申请号:CN200610076775.2
申请日:2006-04-20
Applicant: 北京理工大学
IPC: G06F17/30
Abstract: 本发明涉及一种快速构造用于关键词检出任务的语音数据库的方法。其中执行以下步骤:步骤1,录制孤立词语音数据库;步骤2,根据关键词检出系统的要求确定关键词表和非关键词表;步骤3,确定关键词检出测试数据的参数如总的句子数,时间长度,关键词出现次数等;步骤4,使用波形拼接的方法将符合关键词检出系统要求的关键词和非关键词语音连接成句子,进而生成满足要求的用于关键词检出任务的数据库。本发明实现了利用已有的孤立词语音数据库快速构造用于关键词检出任务的语音数据库的方法,能灵活的根据不同的要求提供相应的语音数据库。
-
公开(公告)号:CN118711593A
公开(公告)日:2024-09-27
申请号:CN202410724498.X
申请日:2024-06-05
Applicant: 北京理工大学
Abstract: 本发明公开的一种基于复杂场景的自适应声纹识别方法,属于语音领域的自适应声纹识别领域。本发明实现方法为:构建域自适应声纹模型,基于CN‑Celeb数据采用增量学习策略训练自适应声纹模型,通过模型蒸馏实现对已有源域知识的保留和对目标域知识的快速吸收,避免在域迁移过程中的灾难性遗忘;自适应声纹模型通过联合源域和目标域的半监督训练方法,优化自适应声纹模型在两个域上的表现,使自适应声纹模型能够适应新的数据分布,在复杂场景中基于训练好的域自适应声纹模型实现自适应声纹识别,有效克服灾难性遗忘现象。本发明能够提升对复杂场景中自适应声纹识别的准确率和鲁棒性。本发明尤其是能够提升在戏剧、歌声等多变环境下识别的准确率和鲁棒性。
-
-
-
-
-
-
-
-
-