索引合并方法和索引合并装置

    公开(公告)号:CN101882142B

    公开(公告)日:2012-12-26

    申请号:CN200910140421.3

    申请日:2009-05-08

    Abstract: 公开了索引合并方法及装置。索引合并方法包括:确定索引库中是否存在不少于n个的、尺寸符合基于预定基准的预定合并条件的子索引,n为整数且大于等于2,预定基准与预定子索引的尺寸相关;如果确定存在则将确定的子索引作为子索引集;计算如果合并子索引集中的子索引将获得的新子索引的尺寸;在剩余的子索引中查找不少于m个的、尺寸符合基于与新子索引尺寸相关的基准的预定条件的子索引,m为整数且大于等于1;如果找到了则将找到的子索引加入子索引集中并对新的子索引集执行计算步骤和查找步骤;如果未找到则对子索引集中的子索引进行合并。利用根据本发明的方法和/或装置,能够在动态文本集环境下获得较稳定的优化的系统性能。

    多语词典构建装置和多语词典构建方法

    公开(公告)号:CN102789461A

    公开(公告)日:2012-11-21

    申请号:CN201110130234.4

    申请日:2011-05-19

    Inventor: 张洁 孟遥 于浩

    Abstract: 本发明提供一种多语词典构建装置,可以包括:单语词典模块,从预置的单语词典中选取词语,并取得与词语对应的每个义项的释义;关键词提取模块,从释义中提取关键词;双语词典模块,从预置的双语词典中查询出词语的翻译词语,其中,双语词典的其中一种语种与单语词典的语种相同;翻译确认模块,分别计算翻译词语与词语及关键词的相似度,以在翻译词语中为词语选出对应每个义项的最终翻译词语,生成多语词典。本发明还提供一种多语词典构建方法。通过本发明,可以实现一种多语词典的自动构建装置和一种多语词典自动构建方法,节省了词典构建工作消耗的人力物力,保证了生成的多语词典的精确度,基于普通的单语、双语词典就可自动完成多语词典编制。

    确定输入图像中的表单的类别的方法和装置

    公开(公告)号:CN102750514A

    公开(公告)日:2012-10-24

    申请号:CN201110104698.8

    申请日:2011-04-20

    Abstract: 本发明公开了确定输入图像中的表单的类别的方法和装置。所述方法包括:根据输入图像中的表单的线条信息来确定候选类别列表;如果所述候选类别列表不为空,则进一步根据预打印内容来确定输入图像中的表单的类别;如果所述候选类别列表为空,则确定所述输入图像中的表单为新类别。因而,可以以简单高效地方式来自动地确定表单的类别,并可以在表格结构相同的表单中进行区分。

    获取多幅图像的描述信息的方法及装置与图像匹配方法

    公开(公告)号:CN102737243A

    公开(公告)日:2012-10-17

    申请号:CN201110085705.4

    申请日:2011-03-31

    CPC classification number: G06K9/4671 G06K9/6857

    Abstract: 一种获取多幅图像的描述信息的方法及装置与图像匹配方法。获取多幅图像的描述信息的方法包括:针对多幅图像中的每幅图像进行特征点检测,以得到每幅图像的多个特征点;针对每幅图像,根据基于检测到的多个特征点得到的该图像的多个第一局部特征描述子和基于各图像的多个第一局部特征描述子得到的多个第一视觉单词来生成该图像的0级描述信息;以及针对每幅图像执行以下步骤:对该图像进行第n-1次分割,以得到该图像的多幅n-1级子图像;以及根据基于相应特征点所在的n-1级子图像得到的该图像的多个第n局部特征描述子和基于各图像的多个第n局部特征描述子得到的多个第n视觉单词来生成该图像的n-1级描述信息,其中n=2,3,......,K+1,以及K为正整数。

    判断网页类型的方法和装置

    公开(公告)号:CN101872347B

    公开(公告)日:2012-09-26

    申请号:CN200910133695.X

    申请日:2009-04-22

    Inventor: 何楠 王主龙 于浩

    Abstract: 公开了一种判断网页的网页类型的方法和装置。所述方法包括:基于待判断网页的URL,在预先存储的规则列表中进行规则匹配,其中规则列表包括多条用于确定网页类型的规则记录;如果规则匹配成功,则依据成功匹配的规则得到待判断网页的网页类型;如果规则匹配失败,则从待判断网页的URL和/或HTML源代码中提取预定特征,并基于由从提取的预定特征中选择的特征构成的特征向量,使用分类器对待判断网页进行网页类型分类,以得到待判断网页的网页类型。在根据本发明的方案中,能够融合规则识别方案与基于统计学习的识别方案的优点,并且能够实现对包括博客、论坛、新闻等在内的各种网页类型进行判断。

    用于名称消岐聚类的装置和方法

    公开(公告)号:CN102654881A

    公开(公告)日:2012-09-05

    申请号:CN201110056065.4

    申请日:2011-03-03

    Abstract: 提供了用于名称消岐聚类的装置和方法。对名称训练集进行数据处理的装置包括:代表相似度确定单元,用于确定名称训练集的代表相似度,该代表相似度为该名称训练集中的文本间相似度的代表值;优选相似度阈值选择单元,用于采用不同的相似度阈值对该名称训练集进行聚类以选择使聚类效果较佳的相似度阈值作为优选相似度阈值;以及函数拟合单元,用于根据至少两个名称训练集中的每个名称训练集的代表相似度和优选相似度阈值拟合表示代表相似度与优选相似度阈值之间对应关系的函数。

    评价对象聚类方法和装置

    公开(公告)号:CN102375848A

    公开(公告)日:2012-03-14

    申请号:CN201010260750.4

    申请日:2010-08-17

    Abstract: 本发明涉及一种用于将评价对象聚类的方法和装置。所述方法包括:基于语素提取评价对象的语素特征;基于评价对象的上下文提取评价对象的外部关联词语,作为所述评价对象的外部关联特征;以及利用所述语素特征和所述外部关联特征对所述评价对象进行第一聚类。

    三维模型检索装置及其方法和模型库生成装置及其方法

    公开(公告)号:CN102375831A

    公开(公告)日:2012-03-14

    申请号:CN201010254614.4

    申请日:2010-08-13

    Abstract: 本发明公开了一种三维模型检索装置及其方法和模型库生成装置及其方法。根据本发明的三维模型检索装置包括:模型归一化单元,配置为对要查询的三维模型进行旋转和/或平移,使得所述三维模型的主轴方向与三维空间的坐标轴方向一致,并且所述三维模型的重心与系统坐标系的原点一致;二维图像生成单元,配置为在所述系统坐标系的各个坐标轴的正负方向上分别对所述三维模型进行多边形网格投影,生成多个二维图像;模型描述单元,配置为基于所述二维图像,生成所述三维模型的模型描述符;以及检索单元,配置为基于所述模型描述符,在模型库中检索出与所述三维模型相匹配的三维模型。

Patent Agency Ranking