-
公开(公告)号:CN101645082B
公开(公告)日:2011-04-20
申请号:CN200910061694.9
申请日:2009-04-17
Applicant: 华中科技大学
IPC: G06F17/30
Abstract: 本发明提出的基于并行编程模式的相似网页去重系统,包括网页内容预处理模块、网页特征向量提取模块、网页特征指纹计算模块、网页指纹在线去重模块、网页指纹分布式批处理去重模块、基于特定分布式计算平台。该系统能够完成对网络爬虫爬行获得的网页进行文本内容编码的统一转换、文档结构的规范化、舍弃网页噪声内容和分析识别网页的主题内容、连续文本内容的词项切分等环节、形成能够代表网页的特征向量。针对该向量可以使用相关的算法得到代表网页特征的网页指纹。本发明设计提出的系统在互联网海量数据量的情况下,准确、快速地探测由于网站镜像和网络文档转载等因素造成的网页内容完全重复或近似重复,并完成相应的去重工作,从无提高搜索引擎的存储效率,给搜索引擎带来更好的用户体验。
-
公开(公告)号:CN100587715C
公开(公告)日:2010-02-03
申请号:CN200810048164.6
申请日:2008-06-21
Applicant: 华中科技大学
Abstract: 本发明公开了一种基于内容的鲁棒图像拷贝检测方法。先提取测试图像特征矢量:选取原图YCbCr颜色空间的Y平面整体DCT变换系数,计算其顺序测度得到的系数序列作为测试图像的特征矢量;再建立测试图像代表矢量库:对测试图像库图像的特征矢量集进行聚类分析,定义聚类,选取最接近聚类中心的特征矢量作为聚类的代表,构建所有聚类的代表矢量库;最后以查询图像特征矢量及旋转补偿后的图像特征矢量分别检索匹配测试图像代表矢量库,确定所属类别,在此聚类中对各个图像特征矢量进行顺序匹配检索,判别是否存在查询图像的拷贝。本发明表现出较高的鲁棒性,有助于提高查询效率。在数字图像数据库整理、数字图像版权保护和盗版追踪方面具有实用价值,使用范围广泛。
-
公开(公告)号:CN101599165A
公开(公告)日:2009-12-09
申请号:CN200910063081.9
申请日:2009-07-07
Applicant: 华中科技大学
Abstract: 本发明公开了一种动态金融网络监测分析方法,具体包括:(1)建立动态金融网络模型:从金融数据库到有向加权图流的转化过程;(2)计算属性权值:通过分析可疑交易案例库,统计学习得到属性的可疑度权值,简称属性权值;(3)账户和交易可疑度的动态监测分析:通过综合考虑账户和交易的多种属性的共同影响以及前一个时间片对当前时间片的影响,动态监测账户和交易随时间变化的可疑度;(4)更新属性权值:当有新的可疑交易出现时,更新可疑交易案例库和属性权值;(5)动态金融网络模型的增量式更新:当有新的金融交易数据出现时,更新金融数据库和动态金融网络模型。
-
公开(公告)号:CN100476828C
公开(公告)日:2009-04-08
申请号:CN200710052025.6
申请日:2007-04-28
Applicant: 华中科技大学
IPC: G06F17/30
Abstract: 一种基于访问控制的安全搜索引擎系统,包括数据库服务器、单点登录模块、信息描述模块、爬行器模块、查询检索模块和索引库。系统根据资源安全级别对用户信息进行描述;爬行器获取爬行受控资源的权限并采集受安全控制的资源内容;按照用户的查询关键字以及用户的安全等级返回对应的可访问的资源列表;由于不同用户在不同网站上具有不同的权限,搜索引擎根据单点登录信息获取用户的身份信息,并使其能够在访问检索结果资源时不再需要登录操作。本发明通过用户信息描述建立受控资源内容索引,根据用户身份实现个性化的网络搜索引擎,并简化用户访问搜索结果的过程,使搜索引擎返回的结果不仅具有极强的针对性,而且安全控制严格,用户操作简便。
-
公开(公告)号:CN101394398A
公开(公告)日:2009-03-25
申请号:CN200810048824.0
申请日:2008-08-15
Applicant: 华中科技大学
Abstract: 本发明公开了一种面向终端数字接口的内容保护方法及其系统。本发明利用RSA算法为每个接口生成一对公、私钥对;再利用所有合法的接收器的多个公钥生成组密钥,发送器利用该组密钥对数字内容加密;合法的接收器利用拥有的私钥对已加密数字内容解密。系统包括注册与授权服务器,内容发送器和内容接收器。本发明基于RSA算法,RSA算法是目前使用最为广泛的密码算法,安全性较高。目前,世界上还没有任何可靠的攻击RSA算法的方式。只要其密钥的长度足够长,用RSA加密的信息是不能被解破的,本方法通过调整密钥长度就可以保证既具有较高的安全性又有较低的计算复杂性;本方法基于RSA的公钥生成加密密钥,由于RSA的公钥允许公开发布,使本方法具有很好的开放性。
-
公开(公告)号:CN101286161A
公开(公告)日:2008-10-15
申请号:CN200810047855.4
申请日:2008-05-28
Applicant: 华中科技大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于概念的中文问答系统,该系统主要包括数据服务器、问题预处理模块、候选问题集提取模块、问句相似度计算模块。本发明的目的在于提供基于概念的问答系统,该系统能对用户输入的问句处理后的关键词串进行同义扩展,更好的理解问句,进行检索,提高了问答系统的查全率。并且,系统从词形,词序,及词长三方面给出了一种基于概念的中文句子相似度计算方法,提高了检索的查准率。同时,系统采用高效检索技术快速提取候选问题集,计算问句相似度,并对问题集快速排序,将排好序的问题及答案返回给用户。本问答系统从概念上对用户输入的问句进行更精准地理解,检索准确答案。通过实验,表明本系统具有高查全率和查准率。
-
公开(公告)号:CN100424704C
公开(公告)日:2008-10-08
申请号:CN200610124691.1
申请日:2006-09-30
Applicant: 华中科技大学
Abstract: 本发明提供的一种基于密文的全文检索系统,该系统包括数据库、登录模块、查询模块、结果集处理模块、电子文档处理模块、索引模块、审计管理模块、用户管理模块和权限管理模块。其中查询模块包括查询分词模块、查询加密模块、逻辑组合模块、查询子模块、访问控制模块和结果集排序模块;结果集处理模块包括文摘模块和快照模块;索引模块包括索引分词模块、索引加密模块和索引子模块。本发明系统针对索引库不包含索引词在原文的位置信息的情况,提出了一种分词策略——中文语义与自动切分相结合的分词策略,并且在用户访问文档的过程中加入访问控制来限制用户的权限,以保证敏感信息的安全性。本发明系统可以实现密文条件下的全文信息检索,保证了敏感数据的安全性检索,本发明系统具有安全性强、执行效率高的特点。
-
公开(公告)号:CN100394796C
公开(公告)日:2008-06-11
申请号:CN200610018835.5
申请日:2006-04-19
Applicant: 华中科技大学
Abstract: 本发明公开了一种基于数字水印的数字电视审查及监测系统。节目信息管理子系统用于接收来自嵌入终端子系统的服务请求,通过与数据库服务器的数据交互,对服务请求进行处理,并将处理结果发送给嵌入终端子系统;嵌入终端子系统用于向节目信息管理子系统发送节目送审者的服务请求,并接收来自节目信息管理子系统的反馈结果;并从该反馈结果中提取调制加密后的电子许可证并嵌入到数字节目中,或将不允许信息提供给送审者;节目监测子系统用于对传送的电视节目进行监测,当未从传送的节目中检测到电子许可证时,把该节目的相关信息作为警报信息,发送至数据库服务器。本发明具有电子许可证不可伪造、监测实时和可行性高的特点。
-
公开(公告)号:CN100367295C
公开(公告)日:2008-02-06
申请号:CN200610018494.1
申请日:2006-03-07
Applicant: 华中科技大学
Abstract: 本发明公开了一种基于三层架构的智能图像隐写分析系统,包括综合数据库、图像库、综合数据库管理模块、图像库管理模块、特征矢量预提取模块、隐写分析总控模块和攻击模块,以及用于针对隐写算法已公布且有对应的专用隐写分析算法的专用隐写分析模块、针对隐写算法已公布尚无对应的专用隐写分析算法的分类训练的通用隐写分析模块和针对隐写算法未公布的广义通用隐写分析模块。本发明采用三层架构,针对隐写算法所属类型构建专门的隐写分析子系统,具有准确性和适用性;利用专家系统将现有的专用隐写分析方法建成模型库和规则库,并通过人机交互不断更新隐写分析规则库,具有智能性;采用主元素特征提取与样本图像库分类训练相结合,提高计算效率和准确性。
-
-
-
-
-
-
-
-