-
公开(公告)号:CN104778467B
公开(公告)日:2018-03-06
申请号:CN201510076223.0
申请日:2015-02-12
Applicant: 北京邮电大学
Abstract: 本发明实施例公开了一种曲谱拍照自动播放方法。该方法构建主要包括如下几个关键步骤:获取图像及预处理步骤;利用像素所占比例确定五线谱以及小节位置的步骤;利用图像匹配确定乐曲节拍步骤;确定每个小节的音符步骤;转换为数字信号并进行播放步骤。利用本发明实施例,能够在不懂曲谱的情况下欣赏到曲谱的旋律,同时利用相机拍摄非常的方便,具有很大的实用价值。
-
公开(公告)号:CN106897436A
公开(公告)日:2017-06-27
申请号:CN201710112755.4
申请日:2017-02-28
Applicant: 北京邮电大学
IPC: G06F17/30
CPC classification number: G06F17/30864 , G06F17/3071
Abstract: 本发明实施例公开了一种基于变分推断的学术研究热点关键词提取方法。该系统包括如下步骤:文本预处理步骤,将文本分割清洗成为词语的集合;文本表示步骤,通过TF‑IDF特征加权将词语组成的文本映射到向量空间中成为词向量;层次聚类步骤,使用高斯混合模型表示数据的分布,并通过变分推断方法估计混合模型的参数,将模型划分为几个高斯模型的混合,实现聚类的目的,再对每个类的样本进行高斯混合模型的变分推断,实现层次聚类;结果生成步骤:将层次聚类得到的每个类作为一个话题,类中心里权值最高的词语作为该类的关键词,按照层次聚类的结构生成话题树。利用本发明实施例,能够高效、准确地提取一定时间内学术研究的热点关键词,作为一个合理的参考,具有实用价值。
-
公开(公告)号:CN104778467A
公开(公告)日:2015-07-15
申请号:CN201510076223.0
申请日:2015-02-12
Applicant: 北京邮电大学
Abstract: 本发明实施例公开了一种曲谱拍照自动播放系统。该系统构建主要包括如下几个关键步骤:获取图像及预处理步骤;利用像素所占比例确定五线谱以及小节位置的步骤;利用图像匹配确定乐曲节拍步骤;确定每个小节的音符步骤;转换为数字信号并进行播放步骤。利用本发明实施例,能够在不懂曲谱的情况下欣赏到曲谱的旋律,同时利用相机拍摄非常的方便,具有很大的实用价值。
-
公开(公告)号:CN104680176A
公开(公告)日:2015-06-03
申请号:CN201510067912.5
申请日:2015-02-09
Applicant: 北京邮电大学
IPC: G06K9/62
Abstract: 本发明实施例公开了一种基于非高斯中性向量特征选择的脑电波(EEG)信号分类方法。该方法包括如下步骤:通道选择步骤:将输入的每个通道变换并归一化后,取能量最大的M个通道形成一个超向量;非线性去相关步骤:由于每个通道形成的向量是中性向量,可以利用其中性性质进行非线性去相关生成向量u;特征选择步骤:按差分熵或方差从大到小排序,对每个通道分别取Nm个为最终特征;贝塔分类器设计步骤:用贝塔混合模型设计分类器。利用本发明实施例,能够提高脑电波信号分类的准确率,具有很大的实用价值。
-
公开(公告)号:CN103985384B
公开(公告)日:2015-04-15
申请号:CN201410232526.2
申请日:2014-05-28
Applicant: 北京邮电大学
Abstract: 本发明实施例公开了一种基于随机映射直方图模型的文本无关说话人鉴别方法。该方法包括如下步骤:特征提取步骤:将非归一化递增的线谱频率特征变换归一化的差分线谱频率特征并将相邻帧的差分线谱频率特征进行组合生成复合差分线谱频率特征以表达信号的动态特性。模型训练步骤:根据复合差分线谱频率特征的分布特点设计随机映射参数,对训练数据集进行随机映射并通过计算平均直方图来构建概率模型。鉴别步骤:对待鉴别人的语音信号按照步骤一提取特征后输入到步骤二训练得到的模型中,计算针对每个概率模型的似然值,获取最大似然值,确认说话人编号。利用本发明实施例,能够提高文本无关的说话人鉴别率,具有很大的实用价值。
-
公开(公告)号:CN103824561B
公开(公告)日:2015-03-11
申请号:CN201410054042.3
申请日:2014-02-18
Applicant: 北京邮电大学
Abstract: 本发明实施例公开了一种语音线性预测编码模型的缺失值非线性估算方法。该方法包括如下步骤:线谱频率参数变换步骤:将语音线性编码预测模型的线谱频率参数通过线性变换转化为线谱频率参数差值;训练模型步骤;传输过程中丢失部分和收到部分概率分布计算步骤;最小均方误差最优化估计步骤。利用本发明实施例,能够在分组传输丢包的情况下,可靠的实现线性预测模型的最优估计,降低传输损失,提高语音质量,具有很大的实用价值。
-
公开(公告)号:CN116563607B
公开(公告)日:2024-09-17
申请号:CN202310382101.9
申请日:2023-04-11
Applicant: 北京邮电大学
IPC: G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本申请涉及一种基于跨数据集信息挖掘的细粒度图像识别方法与装置。所述方法包括:获取目标细粒度图像;将目标细粒度图像输入训练好的细粒度图像识别神经网络,其中,细粒度图像识别神经网络包括特征提取模块、空间注意力模块、特征去相关模块、特征汇聚模块、识别模块,特征提取模块、空间注意力模块、特征去相关模块、特征汇聚模块、识别模块均为基于跨数据集信息预先训练的;训练好的细粒度图像识别神经网络输出与目标细粒度图像对应的识别结果。本申请通过基于跨数据集信息预先训练的细粒度图像识别神经网络对目标细粒度图像进行识别,因为训练过程学习到了不同数据集之间的正负迁移,也平衡了跨数据集的正负迁移,从而提升了识别精准度。
-
公开(公告)号:CN116363421B
公开(公告)日:2024-06-18
申请号:CN202310269093.7
申请日:2023-03-15
Applicant: 北京邮电大学
IPC: G06V10/764 , G06V10/30 , G06V10/40 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种图像的特征分类方法、装置、电子设备及介质。通过应用本申请的技术方案,可以预先利用噪音添加以及噪音去除的方式来衡量不同域图像之间的域间差异值,并以该域间差异值对特征提取器进行域泛化训练从而得到一个具有更强鲁棒性的特征提取器的图像分类模型。进而避免出现相关技术中存在的,传统的图像分类模型在遇到域偏移场景时存在的分类性能大幅下降的问题。
-
公开(公告)号:CN117237697B
公开(公告)日:2024-05-17
申请号:CN202310960507.0
申请日:2023-08-01
Applicant: 北京邮电大学
IPC: G06V10/764 , G06V10/774 , G06V10/25 , G06V10/42 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 本公开涉及一种小样本图像检测方法、系统、介质及设备,方法包括:向图像检测模型中输入样本数据并对所述样本数据进行数据增强得到增强后的增强数据;从所述增强数据中利用卷积神经网络提取特征向量;生成用于分类器检测和定位目标的第一区域候选框,对所述第一区域候选框进行降采样得到第二区域候选框并根据所述第二区域候选框的坐标提取出所述特征向量中的特征;利用多层全连接网络对传入的特征进行分类和回归,以得到预测目标的位置和标签;计算图像检测模型的损失并更新图像检测模型的参数。不同于传统的基于候选框的预测方法:单个候选框预测单个实例。针对不同程度的遮挡问题进行算法的优化:在生成候选框之后,为每个候选框预测一组实例。
-
公开(公告)号:CN117994507A
公开(公告)日:2024-05-07
申请号:CN202211629088.4
申请日:2022-12-19
Applicant: 北京邮电大学
IPC: G06V10/26 , G06V10/82 , G06N3/08 , G06N3/0464
Abstract: 本发明涉及一种图像语义分割模型的训练方法方法、装置、计算机设备和存储介质,方法包括:获取训练图像训练集;将训练图像训练集中的训练图像分批次输入待训练图像语义分割模型的编码模块,编码模块输出各批次训练图像的高阶特征;根据当前批次的高阶与当前批次之前的第二预设数量的高阶特征的语义关系对当前批次的高阶进行增强处理;将增强后的当前批次的高阶特征输入待训练图像语义分割模型的解码模块,解码模块输出当前批次的训练图像的语义分割结果;根据语义分割结果,对待训练图像语义分割模型进行训练。上述方法可以提高对测试图像集的测试准确性。
-
-
-
-
-
-
-
-
-