一种社交网络低质量图像中的字幕识别方法

    公开(公告)号:CN107480671A

    公开(公告)日:2017-12-15

    申请号:CN201610406013.8

    申请日:2016-06-08

    CPC classification number: G06K9/3266

    Abstract: 本发明为一种社交网络低质量图像中的字幕识别方法,包括(1)图像预处理;(2)MSER提取;(3)文字检测;(4)区域合成;(5)文本检测;最终获取识别结果。本发明支持对社交网络中低质量图像中字幕的检测。支持对低质量图像字幕的识别,低质量主要表现为字幕嵌入在复杂图像背景中、字幕中字符分辨率低,且笔画模糊,部分相邻字符粘连;支持识别常用低质量中英文字符、数字和标点符号,其中中文字符集至少包括GB2312-1内的3755个简体汉字。

    一种微博突发话题检测方法及装置

    公开(公告)号:CN106294333A

    公开(公告)日:2017-01-04

    申请号:CN201510236634.1

    申请日:2015-05-11

    Abstract: 本发明提供一种微博突发话题检测方法及装置,用以解决目前微博突发话题难以识别的问题,该方法包括,提取指定的微博数据集合中的特征项,特征项为包含具体语义的语言单元;确定特征项在微博数据集合的文本中的流通度以及特征项当前的热度;以流通度为质量参数项,以热度为位置参数项对特征项进行动力学建模,得到特征项的当前能量和加速度;在得到的能量以及加速度分别大于第一预设值以及第二预设值时,检测突发特征项;根据检测到的突发特征项在同一条微博中同时出现的情况计算突发特征项之间的互信息;当互信息大于第三阈值时,对突发特征项进行合并,得到突发话题,该方案能够提高微博突发话题检测的准确率。

Patent Agency Ranking