-
公开(公告)号:CN103927367A
公开(公告)日:2014-07-16
申请号:CN201410161456.6
申请日:2014-04-22
Applicant: 上海数据分析与处理技术研究所 , 上海交通大学 , 上海鹏越惊虹信息技术发展有限公司
IPC: G06F17/30
CPC classification number: G06F17/30896 , G06F17/30917
Abstract: 一种信息安全技术领域的基于事件的微博采集系统及方法,该系统包括:URL构造模块、JSSH客户端模块、浏览器采集模块以及HTML解析模块,URL构造模块与JSSH客户端模块相连接并传输采集的URL信息,JSSH客户端模块与浏览器采集模块相连接并传输JSSH指令,浏览器采集模块与HTML解析模块相连接并传输HTML文本信息。本发明能够将一条微博可以解析出微博作者名、微博作者主页URL、微博作者头像URL、微博正文内容、微博短链接、微博发布时间、微博发布客户端、转发数、评论数等等抽象数据,从而将每一条原本非结构化数据变成结构化数据,从而实现抽象数据的具体化,供后续数据挖掘使用。
-
公开(公告)号:CN103310236A
公开(公告)日:2013-09-18
申请号:CN201310261621.0
申请日:2013-06-27
Applicant: 上海数据分析与处理技术研究所 , 上海交通大学 , 上海鹏越惊虹信息技术发展有限公司
Abstract: 一种图像处理及信息安全技术领域的基于局部二维特征的拼接图像检测方法及系统,通过将图像采用不同边长的正方形分割后进行分块DCT变换,并将得到的分块DCT系数采用局部二维特征的方式进行描述并合并为完整检测特征后,采用分类器进行分类。本发明能够兼顾检测精度和检测复杂度,检测精确度可以达到89.9%。
-