-
公开(公告)号:CN113139548B
公开(公告)日:2022-05-06
申请号:CN202011638890.0
申请日:2020-12-31
Applicant: 重庆邮电大学
IPC: G06V30/148 , G06V10/774 , G06V10/82 , G06K9/62 , G06N3/04
Abstract: 本发明提出了一种基于运算符和中心线的数学公式识别的方法,其主要思路为:对公式图片进行切割;应用卷积神经网络(CNN)网络结构对字符图片进行识别;充分利用公式中不同种类运算符作用域固定的特点将其分为三类,分别是分号、特殊运算符和二元运算符号,其中特殊运算符包括根号、求和符号、积分符号等大符号,这些运算符有多个作用域,先将这些作用域内的子式判别出来并进行识别,将识别结果直接送入运算符的Latex语言表达式;然后基于字符在书写时受四线格约束的情况,提出中心线的概念,将常见字符分类为向上类、向下类、全占类和中心类,依据字符的中心线类别不同计算阈值,判断两个字符之间的上下标的位置关系。最终实现公式识别。
-
公开(公告)号:CN113139548A
公开(公告)日:2021-07-20
申请号:CN202011638890.0
申请日:2020-12-31
Applicant: 重庆邮电大学
Abstract: 本发明提出了一种基于运算符和中心线的数学公式识别的方法,其主要思路为:对公式图片进行切割;应用卷积神经网络(CNN)网络结构对字符图片进行识别;充分利用公式中不同种类运算符作用域固定的特点将其分为三类,分别是分号、特殊运算符和二元运算符号,其中特殊运算符包括根号、求和符号、积分符号等大符号,这些运算符有多个作用域,先将这些作用域内的子式判别出来并进行识别,将识别结果直接送入运算符的Latex语言表达式;然后基于字符在书写时受四线格约束的情况,提出中心线的概念,将常见字符分类为向上类、向下类、全占类和中心类,依据字符的中心线类别不同计算阈值,判断两个字符之间的上下标的位置关系。最终实现公式识别。
-
公开(公告)号:CN109040855B
公开(公告)日:2021-01-29
申请号:CN201811019788.5
申请日:2018-09-03
Applicant: 重庆邮电大学
IPC: H04N21/845 , H04N21/262 , H04N21/2662 , H04N21/2385
Abstract: 本发明涉及流媒体码率自适应技术领域,特别涉及一种无线DASH流媒体码率平滑自适应传输方法,包括统计前N个切片的下载速率数据,预测无线网络的带宽趋势以及带宽值;根据预测的带宽趋势、带宽值以及缓存占用情况,切片调度模型自适应选择最优码率;本发明的方法考虑多组参数,对无线网络的带宽变化趋势做出准确判断的同时,可以“平滑”处理带宽的短暂波动,本发明在维持较少码率切换次数的同时在视频播放过程中提供较高的平均码率,为观众提供良好的无线端视频体验质量。
-
公开(公告)号:CN111401353A
公开(公告)日:2020-07-10
申请号:CN202010185356.2
申请日:2020-03-17
Applicant: 重庆邮电大学
Abstract: 本发明属于光学字符识别领域,具体涉及一种数学公式的识别方法、装置及设备;所述方法包括获取待识别的数学公式图片,并对其进行预处理;采用LeNet分类器从待识别的数学公式图片中区分出多行数学公式图片和单行数学公式图片;将多行数学公式图片经过投影的方式切割为多个单行数学公式图片;对所有的单行数学公式图片分割为单个的数学字符图片;采用神经网络识别出每个数学字符图片的种类;利用改进的基线识别方法识别出单个数学字符之间的相对位置;并形成待识别的数学公式图片的语义树,将语义树解析成latex语言并输出。本发明具有识别公式字符识别率较高,结构识别较完整的优点。
-
公开(公告)号:CN109743732A
公开(公告)日:2019-05-10
申请号:CN201811563659.2
申请日:2018-12-20
Applicant: 重庆邮电大学
Abstract: 本发明提出一种基于改进的CNN-LSTM的垃圾短信判别方法,其步骤在于,首先进行文本长度均值化,把文本最长的长度和大部分文本集中的长度做均值,长度不足的进行特征扩展,长度过长的短信文本进行特征重要性排序并选择,然后从大规模背景语料训练中得到具有语义特征信息的Glove词向量作为深层神经网络的初始输入。下一步再构建改进的CNN-LSTM的垃圾短信识别的模型。最后将输出放入Softmax分类器中得出分类结果。此发明不仅可以改善深度学习参数过多的问题,还可以更好地整合短信文本特征,具有很好的研究意义和应用价值。
-
公开(公告)号:CN109743732B
公开(公告)日:2022-05-10
申请号:CN201811563659.2
申请日:2018-12-20
Applicant: 重庆邮电大学
IPC: H04W12/128 , G06K9/62 , G06N3/04 , H04W4/14
Abstract: 本发明提出一种基于改进的CNN‑LSTM的垃圾短信判别方法,其步骤在于,首先进行文本长度均值化,把文本最长的长度和大部分文本集中的长度做均值,长度不足的进行特征扩展,长度过长的短信文本进行特征重要性排序并选择,然后从大规模背景语料训练中得到具有语义特征信息的Glove词向量作为深层神经网络的初始输入。下一步再构建改进的CNN‑LSTM的垃圾短信识别的模型。最后将输出放入Softmax分类器中得出分类结果。此发明不仅可以改善深度学习参数过多的问题,还可以更好地整合短信文本特征,具有很好的研究意义和应用价值。
-
公开(公告)号:CN111401353B
公开(公告)日:2022-04-05
申请号:CN202010185356.2
申请日:2020-03-17
Applicant: 重庆邮电大学
IPC: G06V30/14 , G06V30/148 , G06V30/19 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明属于光学字符识别领域,具体涉及一种数学公式的识别方法、装置及设备;所述方法包括获取待识别的数学公式图片,并对其进行预处理;采用LeNet分类器从待识别的数学公式图片中区分出多行数学公式图片和单行数学公式图片;将多行数学公式图片经过投影的方式切割为多个单行数学公式图片;对所有的单行数学公式图片分割为单个的数学字符图片;采用神经网络识别出每个数学字符图片的种类;利用改进的基线识别方法识别出单个数学字符之间的相对位置;并形成待识别的数学公式图片的语义树,将语义树解析成latex语言并输出。本发明具有识别公式字符识别率较高,结构识别较完整的优点。
-
公开(公告)号:CN111062264A
公开(公告)日:2020-04-24
申请号:CN201911180193.2
申请日:2019-11-27
Applicant: 重庆邮电大学
Abstract: 本发明提供了一种基于双通路混合卷积网络的文档对象分类方法,用于实现对文档图片中各个逻辑对象(文本、公式、表格、图像)的分割与分类。其方案为,首先对输入图片进行多模式匹配递归RLSA分析确定分割坐标;然后根据分割坐标把输入图片分割为不同的逻辑区域;再对区域进行标签标记,噪声去除和类别均衡处理,得到分类数据集;接着把二维图区域片送入到二维CNN训练,把该图片提取其两方向投影送入到一维CNN网络训练;最后用这两个卷积网络前七层作为特征提取器,通过双通路混合分类网络进行最终模型的训练,利用该模型可预测出区域图片的对象类别;本发明分别利用原始二维图片和其两方向投影的作为输入,利用了不同特征,提高了分类精度。
-
公开(公告)号:CN109040855A
公开(公告)日:2018-12-18
申请号:CN201811019788.5
申请日:2018-09-03
Applicant: 重庆邮电大学
IPC: H04N21/845 , H04N21/262 , H04N21/2662 , H04N21/2385
CPC classification number: H04N21/8456 , H04N21/2385 , H04N21/26216 , H04N21/2662
Abstract: 本发明涉及流媒体码率自适应技术领域,特别涉及一种无线DASH流媒体码率平滑自适应传输方法,包括统计前N个切片的下载速率数据,预测无线网络的带宽趋势以及带宽值;根据预测的带宽趋势、带宽值以及缓存占用情况,切片调度模型自适应选择最优码率;本发明的方法考虑多组参数,对无线网络的带宽变化趋势做出准确判断的同时,可以“平滑”处理带宽的短暂波动,本发明在维持较少码率切换次数的同时在视频播放过程中提供较高的平均码率,为观众提供良好的无线端视频体验质量。
-
-
-
-
-
-
-
-