用于网络文件的多维索引的方法和设备

    公开(公告)号:CN102270201A

    公开(公告)日:2011-12-07

    申请号:CN201010192559.0

    申请日:2010-06-01

    Abstract: 本发明公开了一种用于网络文件的多维索引的方法和设备,其中为文档建立索引的方法包括:识别构成所述文档的特征;将所述特征中的每一个的维度分类为主维度、次维度和附加维度中之一;针对所述主维度的特征和所述次维度的特征建立扩展的倒排索引,所述扩展的倒排索引中包含所述次维度的特征;针对所述附加维度的特征建立倒排索引;将针对所述主维度的特征和所述次维度的特征建立的扩展的倒排索引与针对所述附加维度的特征建立的倒排索引相结合,得到复合索引;以及将所述复合索引存储到索引储存库中。

    情感倾向性分析方法和装置

    公开(公告)号:CN102236636A

    公开(公告)日:2011-11-09

    申请号:CN201010157784.0

    申请日:2010-04-26

    Abstract: 本发明公开了一种用于分析对研究对象的情感倾向性的方法和装置。所述方法包括:获取粗粒度的情感倾向性;获取细粒度的情感倾向性;以及将粗粒度的情感倾向性和细粒度的情感倾向性结合,获取对该研究对象的情感倾向性;其中获取细粒度的情感倾向性的步骤包括:基于在句子粒度或者段落粒度上确定的与主题词相关的情感词进行情感倾向性分析;其中获取粗粒度的情感倾向性的步骤包括:基于在段落粒度或者文档粒度上确定的与主题词相关的情感词进行情感倾向性分析。

    云服务系统及其中管理用户权限的方法

    公开(公告)号:CN102195956A

    公开(公告)日:2011-09-21

    申请号:CN201010131235.6

    申请日:2010-03-19

    Abstract: 云服务系统及其中管理用户权限的方法。云服务系统包括:用户登录服务器,响应于用户登录确定用户的一或多个角色;权限管理服务器,包括一或多个判断逻辑,其每个对应于一个指定角色、应用、操作和判断逻辑的应用访问规则,对于每个应用访问规则,所指定的判断逻辑能够根据预定条件确定充当所指定的角色的用户是否被允许在所指定的应用中执行所指定的操作;应用访问控制服务器,响应于角色的确定而确定指定有角色的一或多个应用访问规则,并且请求权限管理服务器执行应用访问规则所指定的判断逻辑;应用管理服务器,响应于判断逻辑的确定结果生成有关允许用户使用的应用及操作的信息;及应用前端服务器,根据信息向用户呈现相应应用及操作。

    网页下载的方法和装置
    174.
    发明公开

    公开(公告)号:CN102163203A

    公开(公告)日:2011-08-24

    申请号:CN201010120118.X

    申请日:2010-02-24

    Abstract: 本发明提供了网页下载的方法和装置。所述方法包括:选取步骤,从多个网页中选取至少一个列表页面;模板生成步骤,根据所述至少一个列表页面中的一个或多个来生成列表页面模板;下载更新步骤,利用所述列表页面模板和所述至少一个列表页面来下载和/或更新所述至少一个列表页面中所包含的主题的主题页面。根据本发明的网页下载的方法和装置,可以针对具有多个结构相似的网页的网站进行高效、自动的网页下载。

    字符识别的方法和设备
    175.
    发明公开

    公开(公告)号:CN102129560A

    公开(公告)日:2011-07-20

    申请号:CN201010004058.5

    申请日:2010-01-18

    Abstract: 提供了用于字符识别的方法和设备。该方法包括:确定待识别的字符图像中的每个候选分割点上的一个或更多个候选分割路径,其中,至少一个候选分割点上具有多个候选分割路径;利用每个候选分割路径来分割所述待识别的字符图像,以产生多个图像部分;分别对所述多个图像部分进行识别,从而得到多个识别结果;及根据所述识别结果,在所述候选分割点及其候选分割路径中选择所述字符图像的最佳分割点和每个最佳分割点上的最佳分割路径。

    模板提取方法和装置

    公开(公告)号:CN102129422A

    公开(公告)日:2011-07-20

    申请号:CN201010004202.5

    申请日:2010-01-14

    Abstract: 本发明公开了一种模板提取方法和装置。所述模板提取方法包括:对语料进行包括分句和分词在内的预处理;从预处理后的语料中提取出候选模板;以及对提取出的候选模板进行优化。其中,所述优化步骤包括:针对每一个候选模板,计算由该候选模板中的通配符所代表的词或词序列在语料中出现的频率以及该候选模板中由通配符分隔出的词或词序列在语料中出现的频率;以及确定其中通配符所代表的词或词序列在语料中出现的频率以及所述候选模板中由所述通配符分隔出的词或词序列在语料中出现的频率满足预定条件的候选模板为干扰模板,并从所提取出的候选模板中去除所述干扰模板。

    信息抽取方法和装置
    177.
    发明公开

    公开(公告)号:CN102073653A

    公开(公告)日:2011-05-25

    申请号:CN200910226105.8

    申请日:2009-11-20

    Abstract: 本发明公开了一种信息抽取方法和装置。其中该信息抽取方法包括:a)获取第一评价信息的初始种子;b)确定与第一评价信息的种子关联的第二评价信息;c)根据与第一评价信息的种子关联出现的第二评价信息的权重来确定新的第二评价信息的种子;d)确定与第二评价信息的种子关联的第一评价信息;e)根据与第二评价信息的种子关联出现的第一评价信息的权重来确定新的第一评价信息的种子;f)判断是否满足迭代结束条件,如果否,则又执行步骤b)至e),否则输出所获得的第一评价信息和第二评价信息。此外,本发明还公开了一种相应的信息抽取装置。

    WEB认证装置、系统和方法
    178.
    发明公开

    公开(公告)号:CN102065063A

    公开(公告)日:2011-05-18

    申请号:CN200910221838.2

    申请日:2009-11-13

    Abstract: 提供一种WEB认证系统和方法,所述系统包括客户端安全装置,服务端认证装置以及通信装置,其中,所述客户端安全装置中存储有认证号;所述服务端认证装置用于:监听来自客户端的登录请求,所述登录请求包括用户的用户名和口令;在监听到来自客户端的登录请求后,经由通信装置获取所述客户端安全装置的认证号;以及针对所述登录请求,对所述认证号、用户名和口令一起进行认证;以及所述通信装置用于负责所述认证号在客户端安全装置与服务端认证装置之间的传输。还提供了一种WEB服务端认证装置和WEB客户端安全装置。

    字符串识别装置和方法
    179.
    发明公开

    公开(公告)号:CN102024139A

    公开(公告)日:2011-04-20

    申请号:CN200910173870.8

    申请日:2009-09-18

    Abstract: 本发明公开了一种识别字符串的方法,包括以下步骤:将字符串图像划分为多个片段;对所述多个片段进行OCR识别,获得候选字符,其中,每一个片段对应于至少一个候选字符;获取片段的候选字符和/或片段的候选字符形成的字符组合的统计信息;以及结合所述统计信息以及候选字符的OCR识别置信度来确定候选字符串。此外,本发明还公开了一种字符串识别装置。

    词典生成装置以及信息检索装置

    公开(公告)号:CN101571852B

    公开(公告)日:2011-04-20

    申请号:CN200810091300.X

    申请日:2008-04-28

    Inventor: 夏迎炬 于浩

    Abstract: 本发明涉及词典生成装置以及信息检索装置。所述词典生成装置包括:词频统计部,用于统计在包括关注语言和对比语言的多语语料中,所述关注语言的关注词条的词频以及所述关注词条的对比词条的词频,所述对比词条是所述关注词条的所述对比语言的翻译词;词频相似度计算单元,计算所述关注词条的词频和所述对比词条的词频的词频相似度;以及词条选择单元,根据所述词频相似度计算单元计算出的词频相似度,确定字典用词条。

Patent Agency Ranking