用于对命名实体进行分类的方法和装置

    公开(公告)号:CN102436456A

    公开(公告)日:2012-05-02

    申请号:CN201010506217.1

    申请日:2010-09-29

    Inventor: 倪渊 张雷 裘照明

    CPC classification number: G06F17/3071

    Abstract: 本发明提供了用于对命名实体进行分类的方法和装置。所述方法包括:从链接开放数据LOD数据集中读取与待分类命名实体对应的LOD节点;将所述与该待分类命名实体对应的LOD节点的类型属性作为所述待分类命名实体的标注类型;读取候选类型;和根据所述标注类型计算该待分类命名实体属于所述候选类型的可能性。根据本发明的技术方案,可以利用网络上存在的大量信息来帮助对命名实体进行分类。

    基于现有本体产生新概念的系统和方法

    公开(公告)号:CN1877566B

    公开(公告)日:2010-06-16

    申请号:CN200510077807.6

    申请日:2005-06-09

    CPC classification number: G06F17/2785

    Abstract: 提供基于现有本体自动产生新概念的系统及其方法。所述系统基于自然语言格式表达的新概念描述在现有本体中建立新概念,包括:正规化部件,用于接收并分析新概念描述,以将其转换成正规化概念描述并输出,其中所述正规化概念描述包括一个或多个具有核心术语的描述部分,所述描述部分只能含有在所述现有本体中能辨识的术语,而所述核心术语包括中心词、零个或多个特性;以及新概念产生部件,用于基于正规化后的新概念描述,识别每一个正规化概念描述部分中的核心术语,并将所识别到的核心术语、相关特征以及核心术语间的关系提取出来,以便用户根据现有本体建立新概念。因此,本体可以轻而易举地被管理、扩充或重用,同时又能保持本体的小尺寸和低复杂性。

    建立多维模型和数据仓库模式的映射的方法及相关系统

    公开(公告)号:CN101286151A

    公开(公告)日:2008-10-15

    申请号:CN200710096351.7

    申请日:2007-04-13

    CPC classification number: G06F17/30592

    Abstract: 本发明提供一种用于建立多维模型和数据仓库模式的映射的系统。该系统包括:多维模型编辑器,用于基于概念模型定义多维模型;映射推理器,用于通过基于概念模型进行推理从基本映射生成更多的简单映射;数据仓库模式分析器,用于通过对数据仓库模式的信息进行分析,生成能够表达数据仓库模式信息的数据结构;映射合成引擎,用于通过在数据结构中寻找对应于多维模型的本体路径的相应元素的路径生成结果映射,其中对多维模型的本体路径的相应元素的映射由映射推理器提供。本发明还提供相应的方法和计算机程序产品。通过本发明,基于对现有基本映射的重用,在建立多维模型到数据仓库模式的映射时,能够辅助用户更加简便和高效地创建其中的复杂映射。

    词义消歧的机器翻译方法和系统

    公开(公告)号:CN1302030A

    公开(公告)日:2001-07-04

    申请号:CN99126567.X

    申请日:1999-12-24

    CPC classification number: G06F17/2785 G06F17/2845 G06F17/2872

    Abstract: 本发明公开了一种词义消歧的机器翻译方法和系统,该方法和系统在对第一种语言的文本进行翻译时,如果根据上下文无法确定要翻译的字、词在第二种语言中的词义,则判断所述字、词或所述字、词所在的句子是否存在有关超链接的信息。如果存在有关超链接的信息,则根据有关超链接的信息导出相关文本,基于所述相关文本将所述字、词翻译成第二种语言。该方法和系统通过对相关文本的动态分析提高了机器翻译的准确性。

    同时实现关系持久化和语义网风格访问的系统及方法

    公开(公告)号:CN101593103B

    公开(公告)日:2013-04-17

    申请号:CN200810108780.6

    申请日:2008-05-29

    Abstract: 本发明提出一种系统和方法,使得对于对象同时实现关系持久化和语义网风格访问,该系统包括:对象-关系(OR)映射生成器,用于从输入的面向对象(OO)模型生成OR映射和关系模式;模型转换器,用于从所述输入的OO模型生成本体网语言(OWL)本体;以及语义映射生成器,用于从OR映射、关系模式和OWL本体生成语义映射,以便用于语义网风格访问。本发明提供了一种工具,通过输入OO模型,不仅接收到用于关系持久化的关系模式,而且接收到用于语义网风格访问的OWL本体。

    同时实现关系持久化和语义网风格访问的系统及方法

    公开(公告)号:CN101593103A

    公开(公告)日:2009-12-02

    申请号:CN200810108780.6

    申请日:2008-05-29

    Abstract: 本申请提出一种系统和方法,使得对于对象同时实现关系持久化和语义网风格访问,该系统包括:对象-关系(OR)映射生成器,用于从输入的面向对象(OO)模型生成OR映射和关系模式;模型转换器,用于从所述输入的OO模型生成本体网语言(OWL)本体;以及语义映射生成器,用于从OR映射、关系模式和OWL本体生成语义映射,以便用于语义网风格访问。本发明提供了一种工具,通过输入OO模型,不仅接收到用于关系持久化的关系模式,而且接收到用于语义网风格访问的OWL本体。

    训练语料扩充系统和方法

    公开(公告)号:CN1940915A

    公开(公告)日:2007-04-04

    申请号:CN200510108065.9

    申请日:2005-09-29

    CPC classification number: G06F17/2715 G06F17/30731

    Abstract: 本发明提供一种通过扩充新的样本种子来自动扩充训练语料的系统和方法。其中使用样本种子收集训练语料;基于已有的样本种子和被收集的训练语料,产生新的样本种子;基于收集训练语料时所使用过的所有样本种子和新的样本种子确定训练语料扩充策略;按照训练语料扩充策略调整新的样本种子,使用调整后的新的样本种子再次收集训练语料,重复上述步骤直到达到预定的条件。本发明能够以较低的成本方便地从网络或者其它资源中自动扩充训练语料,提高训练语料的覆盖面。

    中文语句分词方法及其在中文查错系统中的应用

    公开(公告)号:CN1193779A

    公开(公告)日:1998-09-23

    申请号:CN97103125.8

    申请日:1997-03-13

    Inventor: 裘照明 杨力平

    CPC classification number: G06F17/273 G06F17/2863

    Abstract: 本发明描述了一种能够有效地检测出中文文本中错误的方案。通过把经常出现的错误、人名、地名、组织名、数词或数量与量词的组合,与常规字典中常用词一样,看成是一般的分词单元,并为它们分配合适的权值,把动态规划方法用于中文查错CEC系统,来对语句进行最为合适的分词处理。该方法可以使CEC系统获得最高的错误检出率,而同时又能够使其误报率在类似的系统中保持为最低。

Patent Agency Ranking