多媒体对象检索设备和方法

    公开(公告)号:CN100336061C

    公开(公告)日:2007-09-05

    申请号:CN200410070553.0

    申请日:2004-08-06

    Abstract: 本发明提供了一种多媒体对象检索设备和方法,用于在同时包含多媒体对象和相关注释文本的结构化文档中检索多媒体对象。本发明的设备和方法对输入的结构化文档进行分析,并将其表示为诸如DOM树那样的某种分析结果;识别所输入的分析结果中的主块,并输出主块标示结构化文档模型;提取多媒体对象和所述注释的配对,并输出诸如XML格式对象索引那样的结构化对象索引;以及在结构化对象索引中进行搜索,并获得目标对象列表。本发明的设备和方法可适用于各种结构化文档,可以更高精度地提取对象注释,可提取内容对象的公共注释,并可标识对象与文档标题间的关系。

    标注信息生成装置、查询装置及共享系统

    公开(公告)号:CN101551800A

    公开(公告)日:2009-10-07

    申请号:CN200810086799.5

    申请日:2008-03-31

    Abstract: 本发明公开了标注信息生成装置、查询装置及共享系统,所述标注信息生成装置包括标注对象选择单元、标注内容输入单元、网页内元素路径确定单元、标注信息生成单元以及发送单元,标注对象选择单元选择待标注的网页中的待标注的对象,即标注网页对象中的标注对象;标注内容输入单元输入针对所述标注对象的标注,即标注内容;网页内元素路径确定单元确定所述标注对象在所述标注网页对象中的路径,即网页内元素路径;所述标注信息生成单元生成标注信息,所述标注信息包括标注网页对象路径信息、所述标注对象的网页内元素路径、所述标注内容输入单元输入的标注;以及所述发送单元将所述标注信息生成单元生成的标注信息发送到标注信息服务器。

    文件处理装置与记录媒体

    公开(公告)号:CN1109994C

    公开(公告)日:2003-05-28

    申请号:CN98813873.5

    申请日:1998-12-24

    CPC classification number: G06F17/30616 Y10S707/99933

    Abstract: 本发明用于提高文件检索和裁剪精度。其中从文件输入部(1)输入处理对象文件,事件确定装置(4)参考知识信息存储装置(3)中存储的知识信息,确定输入文件中记述的事件的种类,属性值提取装置(5)从文件中提取所确定的事件属性的属性值,相关装置(10)使属性值提取装置(5)所提取的属性值相对于现实中的实体进行相关处理,文件存储装置11将相关装置(10)生成的信息(规范化信息)与确定文件或文件存储地的信息相关联并存储,文件提取装置(2)比较用户接口部(2)输入的查询与规范化信息,从文件存储装置(11)输出确定相应文件或文件存储地的信息。

    基于数据挖掘获取词或词组单元译文信息的系统和方法

    公开(公告)号:CN1928862A

    公开(公告)日:2007-03-14

    申请号:CN200510102518.7

    申请日:2005-09-08

    Abstract: 本发明为基于数据挖掘获取词或词组单元译文信息的系统和方法。包括:输入装置,用于输入词或词组单元;候选译文统计装置,根据输入所述的词或词组单元收集有效的电子文档和网页,在此基础上构建候选译文、发现候选译文的边界、统计候选译文的特征;候选译文噪声处理装置,用于对所述候选译文统计装置形成的噪声进行识别和处理;候选译文评价装置,根据所述候选译文统计装置得到的候选译文的特征,对每个可能的候选译文进行评价排序;候选译文典型例句挖掘装置,用于在Web上挖掘出候选译文的典型例句,并根据其典型程度排序;输出装置。使用户输入任意词典未收录的词或词组单元系统返回在另一种语言中按权值大小排列的翻译候选列表及其典型用法。

    一种基于语素标注的自然语言成分识别、校正装置及方法

    公开(公告)号:CN100533431C

    公开(公告)日:2009-08-26

    申请号:CN200510103566.8

    申请日:2005-09-21

    Abstract: 本发明为一种基于语素标注的自然语言成分识别、校正装置及方法,包括:输入部,用于输入待分析符号序列;语素学习部,用于生成语素属性,并从待分析自然语言成分的标注样本中学习得到语素与所述语素属性之间的关系规律;语素属性标注部,用于对输入的待分析符号序列进行语素属性标注,生成语素属性标注序列;分析成分合成部,用于从语素属性标注序列中识别出需要的自然语言成分及该自然语言成分的分类标记;输出部,用于输出所述分析成分合成部的识别结果。用以从输入的汉语、日语等自然语言或基因组等符号序列中识别出需要的语言成分或遗传因子等符号组,并标注出识别成分的分类属性。从而解决诸如汉语的未登录词等问题。

    基于数据挖掘获取词或词组单元译文信息的系统和方法

    公开(公告)号:CN100474301C

    公开(公告)日:2009-04-01

    申请号:CN200510102518.7

    申请日:2005-09-08

    Abstract: 本发明为基于数据挖掘获取词或词组单元译文信息的系统和方法。包括:输入装置,用于输入词或词组单元;候选译文统计装置,根据输入所述的词或词组单元收集有效的电子文档和网页,在此基础上构建候选译文、发现候选译文的边界、统计候选译文的特征;候选译文噪声处理装置,用于对所述候选译文统计装置形成的噪声进行识别和处理;候选译文评价装置,根据所述候选译文统计装置得到的候选译文的特征,对每个可能的候选译文进行评价排序;候选译文典型例句挖掘装置,用于在Web上挖掘出候选译文的典型例句,并根据其典型程度排序;输出装置。使用户输入任意词典未收录的词或词组单元系统返回在另一种语言中按权值大小排列的翻译候选列表及其典型用法。

    字典检索装置
    10.
    发明授权

    公开(公告)号:CN1095137C

    公开(公告)日:2002-11-27

    申请号:CN94104998.1

    申请日:1994-04-29

    CPC classification number: G06F17/2795

    Abstract: 本发明为一个字典检索装置,包括:对字符子集提供组ID的转换字符定义表,以组ID替代字符的字符一组ID转换部分、把来自输入部分的输入字符串转换成输入组ID的输入字符串转换部分、将词字典转换成由表示组ID串定义的转换词字典的字典转换部分、以及由输入组ID串检索转换词字典的字典检索部分。该字典检索装置把转换字符定义表所定义的字符集各元素看作为同一元素。

Patent Agency Ranking