一种微博突发话题检测方法及装置

    公开(公告)号:CN106294333B

    公开(公告)日:2019-10-29

    申请号:CN201510236634.1

    申请日:2015-05-11

    Abstract: 本发明提供一种微博突发话题检测方法及装置,用以解决目前微博突发话题难以识别的问题,该方法包括,提取指定的微博数据集合中的特征项,特征项为包含具体语义的语言单元;确定特征项在微博数据集合的文本中的流通度以及特征项当前的热度;以流通度为质量参数项,以热度为位置参数项对特征项进行动力学建模,得到特征项的当前能量和加速度;在得到的能量以及加速度分别大于第一预设值以及第二预设值时,检测突发特征项;根据检测到的突发特征项在同一条微博中同时出现的情况计算突发特征项之间的互信息;当互信息大于第三阈值时,对突发特征项进行合并,得到突发话题,该方案能够提高微博突发话题检测的准确率。

    网络音频MP3流乱序分段解码方法

    公开(公告)号:CN104202656B

    公开(公告)日:2017-08-04

    申请号:CN201410472027.0

    申请日:2014-09-16

    Abstract: 本发明提供了一种网络音频MP3流乱序分段解码方法,涉及音频流处理技术领域。本方法从网络中捕获音频MP3数据包,获取MP3数据帧并根据位置信息存储在缓存中,一个session建立一个缓存,当有连续MP3数据帧达到指定大小时,进行音频解码。采用FFmpeg技术进行数据块解码,解码时修改相应的上下文,通过伪装的方式让FFmpeg进行解码。采用具有多个加速单元的独立板卡进行解码,加速单元采用FFmpeg技术实现,从而可实现并行解码。无论网络音频MP3以何种顺序接收,本发明方法均能以固定数量的音频帧为单位拼接并进行最大程度解码,并可支持多数据流并发解码,提高了音频流有效帧数的接收率和解码率。

    PCI-E多缓冲区DMA数据传输方法

    公开(公告)号:CN104239248A

    公开(公告)日:2014-12-24

    申请号:CN201410472222.3

    申请日:2014-09-16

    Abstract: 本发明提供了一种PCI-E多缓冲区DMA数据传输方法,涉及PCI-E数据传输技术领域。本方法在数据源系统和数据目的系统中各自分配N块物理内存,分别对两个系统中的N块物理内存通过双向链表建立空闲内存池及工作内存池;从空闲内存池获取用于写入数据的内存,写入数据的内存加入工作内存池;在环形缓冲区中写入所要操作的内存的物理起始地址和大小。本发明通过空闲内存池及工作内存池的使用减少内存拷贝次数和系统调用次数;通过环形缓冲区增加DMA的数据传输速率。本发明在大数据量的传输下降低了系统的等待开销,提高了传输效率。

    藏语方言识别方法及系统

    公开(公告)号:CN104036774A

    公开(公告)日:2014-09-10

    申请号:CN201410280868.1

    申请日:2014-06-20

    Abstract: 本发明公开了一种藏语方言识别方法及系统,该方法包括:预先训练语种识别模型,所述语种识别模型包括:多方言DNN并行音素识别器模型、多方言语言模型;接收待识别藏语方言语音信息;提取所述语音信息的声学特征;利用所述多方言DNN并行音素识别器模型获得对应所述声学特征的音素序列;计算各音素序列在每个语言模型上的似然得分;将似然得分最高的语言模型对应的方言作为所述语音信息对应的方言种类。利用本发明,可以提高藏语方言识别效果。

    一种大数据多区间查询条件下的基数估计方法及装置

    公开(公告)号:CN103544258A

    公开(公告)日:2014-01-29

    申请号:CN201310484503.6

    申请日:2013-10-16

    CPC classification number: G06F17/30864

    Abstract: 本发明涉及一种大数据多区间查询条件下的基数估计方法及装置,包括以下步骤:按照数值属性对大数据预先划分成多个分区;建立树形索引结构,每个分区作为树形索引结构的一个节点;获取待写入树形索引结构的数据源,对支持区间查询条件的数据源进行倒排索引处理;将经过倒排索引处理的数据源写入树形索引结构中的节点内,将数据源的相应部分分别写入数据文件及基数估算器内;根据区间查询条件在树形索引结构中查询满足区间查询条件的节点,得到节点中的基数估算器,对基数估算器进行逻辑处理,得到基数估算值。本发明通过降低数据的计算精度提高基数统计效率,在任意多区间查询条件下,具备较高的查询效率,使用了大数据增量更新技术提高索引数据在线更新效率。

Patent Agency Ranking