构造索引库的方法和设备以及查询方法

    公开(公告)号:CN102135969A

    公开(公告)日:2011-07-27

    申请号:CN201010103610.6

    申请日:2010-01-22

    Abstract: 本发明提供了构造索引库的方法和设备以及查询方法。一种构造索引库的方法,包括:将一个或多个文档中的词汇分类为第一类别或第二类别;以及根据第一类别的词汇来构建单级索引,并根据第二类别的词汇来构建多级索引。本发明能够在支持大规模检索数据的同时提高整体检索响应速度。

    标签位置识别系统及方法、标签方位识别系统及方法

    公开(公告)号:CN102087694A

    公开(公告)日:2011-06-08

    申请号:CN200910253635.1

    申请日:2009-12-07

    Inventor: 陆应亮 于浩

    Abstract: 本发明公开了一种标签位置识别系统及方法和标签方位识别系统及方法。根据本发明的标签位置识别系统包括:识读率特征数据库,配置为存储标签的识读率特征与标签的位置之间的对应关系;识读率记录单元,配置为记录标签的识读率;识读率特征变化提取单元,配置为根据识读率记录单元所记录的识读率提取标签的识读率特征变化;识读率特征变化比较单元,配置为通过比较识读率特征变化提取单元所提取的识读率特征变化与识读率特征数据库中存储的识读率特征,确定待识别的标签可能所处的区间;以及位置计算单元,配置为根据识读率特征变化比较单元确定的待识别的标签可能所处的区间和所述区间的前一区间的识读率确定待识别的标签的位置。

    提取商品属性信息的方法和设备

    公开(公告)号:CN101968788A

    公开(公告)日:2011-02-09

    申请号:CN200910164414.7

    申请日:2009-07-27

    Abstract: 公开了一种用于从包括评论语句的评论信息中提取商品属性信息的方法和设备。所述方法包括:a)对评论信息执行预处理;b)从预处理后的评论信息中提取出候选商品属性信息,并将出现次数满足预定条件的候选商品属性信息提取作为高频商品属性信息;c)通过利用从评论信息中获取的模板,进行基于模板的商品属性信息提取,以从评论信息中提取出补充商品属性信息;和d)根据预定过滤方法,对所述高频商品属性信息和补充商品属性信息进行过滤,并输出过滤后的商品属性信息。利用根据本发明实施例的方法和设备,可无指导地自动提取商品属性信息,而且在保证提取高频商品属性信息的同时,兼顾了商品属性信息提取过程中可能漏掉的非高频商品属性信息。

    生成视频摘要的方法、装置、包含该装置的图像处理系统

    公开(公告)号:CN101887439A

    公开(公告)日:2010-11-17

    申请号:CN200910138455.9

    申请日:2009-05-13

    Abstract: 提供一种用于生成视频信号的视频摘要的方法,包括:视频解码步骤,对视频信号进行解码,以便获得多帧视频解码图像;字幕特性获得步骤,获得所述多帧视频解码图像中包含的所有字幕中每一个字幕的如下特性中的至少一种:字幕的持续时间,字幕在相应的视频解码图像中的位置,字幕的字符尺寸,字幕图像经光学字符识别(OCR)后的识别码和可信度;视频摘要生成步骤,根据所述视频信号的内容与字幕的特性之间的关系,对所获得的字幕的至少一种特性进行处理,以便生成与所述视频信号的内容相适应的视频摘要。本发明的方法使得可生成能准确地反映原始视频文件的主要内容的视频摘要。还提供生成视频信号的视频摘要的装置及其具有该装置的图像处理系统。

    确定网页的搜索引擎优化规则的方法和设备

    公开(公告)号:CN101887438A

    公开(公告)日:2010-11-17

    申请号:CN200910138425.8

    申请日:2009-05-11

    Abstract: 确定网页的搜索引擎优化规则的方法和设备。方法包括向搜索引擎发送搜索请求;从所述搜索引擎接收搜索结果;从所述搜索结果中选择对应网页具有预定网页等级值的多个条目;针对均包含至少一个规则的多个规则组合中的每个规则组合,按照所述多个条目在所述搜索结果中的顺序,计算所述多个条目的每个条目针对所述每个规则组合的所有规则的得分和,以获得所述每个规则组合的得分和序列;和从所述多个规则组合中,选择这样的规则组合作为所述网页的搜索引擎优化规则:在所述规则组合的得分和序列中,包含连续出现的逆序最长的序列。

    基于语义预测的译文获取方法和设备

    公开(公告)号:CN101042692B

    公开(公告)日:2010-09-22

    申请号:CN200610066115.6

    申请日:2006-03-24

    Inventor: 方高林 于浩

    Abstract: 基于语义预测的译文获取方法和设备。所述方法输入一种源语言的查询项,输出该查询项在目标语言中的候选译文列表,其特征是,包括以下步骤:单元分割步骤,将输入的所述查询项尽可能地分割成有意义的候选单元集;单元译文知识库建立步骤,扩充所述候选单元在原始通用词典中的单元候选译文,并对扩充的单元候选译文进行评价形成单元译文知识库;语义预测步骤,利用基于所述单元译文知识库的语义预测的方法获得目标语言中与源语言中的所述查询项语义相关的项;有效网页获取步骤,将前述获得的语义相关项与所述查询项组合,利用组合后的项,通过搜索引擎获得有效网页;候选评价步骤,根据获取的有效网页,对候选译文进行评价得到候选译文列表。

    句法分析装置及句法分析方法

    公开(公告)号:CN101814065A

    公开(公告)日:2010-08-25

    申请号:CN200910118104.1

    申请日:2009-02-23

    Inventor: 孟遥 于浩

    Abstract: 本发明公开了一种句法分析装置和句法分析方法。根据本发明的使用正则表达式规则的句法分析装置包括训练树库、规则获取模块、规则应用模块、句法树生成模块和规则集。规则获取模块通过统计学习的方法从已经标注好的训练树库学习句法分析规则,生成在对输入句子进行分析时使用的规则集。对于产生式规则的后项中的重复部分,规则获取模块应用正则表达式来表示。规则获取模块所学习的句法分析规则还可以包含上下文信息。规则应用模块使用规则获取模块学习获得的句法分析规则集分析输入句子,识别出输入句子的语法成份及成份间的关系。句法树生成模块根据规则应用模块输出的分析结果,按照用户的需求生成输入句子的依存句法关系图或者短语结构型句法分析树。

    三维模型分割装置和方法

    公开(公告)号:CN101807308A

    公开(公告)日:2010-08-18

    申请号:CN200910006405.5

    申请日:2009-02-12

    Abstract: 本发明涉及三维模型分割装置和方法。该三维模型分割方法包括以下步骤:平面检测步骤,检测输入的三维模型中包括的平面,所述输入的三维模型以三角形网格描述;轮廓图提取步骤,根据所述平面检测步骤中检测出的平面,提取所述三维模型的轮廓,即轮廓图;以及轮廓图分离步骤,将所述轮廓图提取步骤提取出的轮廓图分割成若干个子图;三维实体重建步骤,为所述轮廓图分离步骤分割出的各个子图重建三维实体模型,重建出的各三维实体采用三角形网格表达。

    网络搜索方法和设备
    260.
    发明公开

    公开(公告)号:CN101739401A

    公开(公告)日:2010-06-16

    申请号:CN200810173073.5

    申请日:2008-11-26

    Inventor: 杨萌 于浩 王主龙

    Abstract: 本发明公开了一种网络搜索方法和网络搜索设备,网络搜索方法包括以下步骤:获得用于预定网站资源的统一资源定位符URL的变化规则,所述变化规则定义了所述预定网站资源的URL逻辑结构中的固定参数和可变参数、以及可变参数的变化规律;使用所述用于预定网站资源URL的变化规则获取URL;以及通过请求所述获取的URL进行搜索。

Patent Agency Ranking