-
公开(公告)号:CN105677632A
公开(公告)日:2016-06-15
申请号:CN201410663066.9
申请日:2014-11-19
Applicant: 富士通株式会社
IPC: G06F17/27
Abstract: 本发明公开了提取用于抽取实体的模板的方法和设备。根据本发明的提取用于抽取实体的模板的方法包括:从训练语料中,创建参考表,所述参考表包括:符合第一预定条件的普通字符和元字符的组合、相应的评价值;根据参考表,从训练语料中,提取候选模板;利用验证语料,验证候选模板的有效性;根据验证结果,调整所述参考表中的相关评价值;以及在满足第二预定条件时将所述第二预定条件被满足时的候选模板确定为所提取的模板。
-
公开(公告)号:CN106557528A
公开(公告)日:2017-04-05
申请号:CN201510641498.4
申请日:2015-09-30
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本发明提供了一种信息处理装置及方法。其中,信息处理装置包括:第一获取单元,被配置成获取待识别实体的第一属性特征向量,其中,所述第一属性特征向量至少反映语义数据库的属性中的至少一部分在描述语义数据库中包括的特定类型的实体时的重要性程度;以及类型识别单元,被配置成基于所述第一属性特征向量判定所述待识别实体是否属于所述特定类型。根据本发明实施例的方法和装置,可以自动、准确地判定待识别实体是否属于特定类型/子类型,从而在信息处理过程中大大降低计算量并提高查询结果的准确率。
-
公开(公告)号:CN106354728A
公开(公告)日:2017-01-25
申请号:CN201510419244.8
申请日:2015-07-16
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本发明公开了一种利用语义图生成对象之间的关联强度的方法和设备。该方法包括:按照预先确定的针对对象的语义图结构,从与对象相关联的数据集构建语义图,其中,语义图的节点包括对象节点和与对象相关联的关联数据节点,两节点之间的边表明两节点之间存在语义关系,边的权重表明语义关系的强弱;在语义图中搜索第一对象节点与第二对象节点之间满足条件的语义路径;根据每个语义路径包括的边的权重,计算每个语义路径的关联强度;以及根据每个语义路径的关联强度和每个语义路径的权重,计算第一对象节点和第二对象节点之间的关联强度。
-
公开(公告)号:CN107765883A
公开(公告)日:2018-03-06
申请号:CN201610702677.9
申请日:2016-08-22
Applicant: 富士通株式会社
CPC classification number: G06F3/0233 , G06F17/278 , G06F17/2785
Abstract: 本发明公开了一种输入法的候选词语的排序方法和排序设备。该排序方法包括:获得与当前输入对应的多个候选词语;确定多个候选词语中的每一个候选词语与参考词语之间的语义相关度;以及根据所确定的语义相关度,对多个候选词语进行排序;其中,确定多个候选词语中的每一个候选词语与参考词语之间的语义相关度包括:针对每一个候选词语,计算其语义向量与参考词语的语义向量的相似度之和或平均相似度,作为所述语义相关度;其中,所述每一个候选词语的语义向量通过如下步骤获得:将所述每一个候选词语链接到预定知识库中的一个或多个候选实体;以及将所述候选实体的描述输入到语义模型,以得到对应的语义向量。
-
公开(公告)号:CN105095191A
公开(公告)日:2015-11-25
申请号:CN201410164469.9
申请日:2014-04-22
Applicant: 富士通株式会社
IPC: G06F17/28
Abstract: 本发明涉及一种基于多词单元进行辅助翻译的方法和装置,该方法包括:获取用户输入的源语言音节或目标语言音节;获取与用户输入的所述音节相关联的、且取自待翻译源语言文本中的至少一个多词单元;将所述多词单元划分为多个短语,并从划分后的所述多词单元中提取出多个短语组合;利用预先建立的模型,至少根据所述多词单元的各短语组合在所述待翻译源语言文本中出现的频率,计算所述多词单元的权值;根据所述多词单元的权值显示目标语言的多词单元。
-
公开(公告)号:CN107766869A
公开(公告)日:2018-03-06
申请号:CN201610703646.5
申请日:2016-08-22
Applicant: 富士通株式会社
CPC classification number: G06K9/6215 , G06K9/6256 , G06K9/6267 , G06Q30/0255 , G06Q30/0271
Abstract: 本发明公开了一种对象分类方法和对象分类设备。该对象分类方法包括:将表征对象的项目序列转换为对象对应的层次结构;比较对象对应的层次结构与已知类型的层次结构的相似度;以及将相似度最大的层次结构的已知类型确定为对象的类型;其中,所述已知类型的层次结构和/或所述对象对应的层次结构中的节点被泛化,并且层次结构中越深层次中的节点被泛化的数量越多。
-
公开(公告)号:CN106156143A
公开(公告)日:2016-11-23
申请号:CN201510172386.9
申请日:2015-04-13
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本发明实施例提供一种网页处理装置和网页处理方法,用于在实体网页中嵌入资源描述框架属性(RDFa),该装置包括:第一识别单元,其用于识别网页的实体类型,所述实体类型对应有至少一个RDFa;第一划分单元,其基于所述网页的视觉结构以及所述实体类型,将所述网页划分为至少一个语义片段;第一确定单元,根据预先确定的语义片段与RDFa的对应关系,确定所述网页中每个语义片段所对应的所述实体类型中的RDFa,其中,所述对应关系是基于网页检索所获得的训练网页而确定的;以及嵌入单元,其用于在所述网页的每个语义片段中嵌入对应的RDFa。根据本发明实施例,无需对训练网页进行预先的人工标注,从而节省时间和人力,并且具有良好的扩展性。
-
公开(公告)号:CN105094358A
公开(公告)日:2015-11-25
申请号:CN201410213325.8
申请日:2014-05-20
Applicant: 富士通株式会社
Abstract: 公开了一种信息处理装置和通过外码输入目标语言文字的方法。从最近输入的目标语言文字中获得目标语句序列,针对目标语句序列中的每个目标语句,在源语言的源语句序列中识别一个对应源语句子序列。每个所述目标语句是相应源语句子序列的每个源语句的译文的可能性较大,且目标语句序列中相邻目标语句的对应源语句子序列在源语句序列中的相互距离较小。每个源语句子序列包含尽可能多的可能性较大的连续源语句。估计源语句序列中的可能当前源语句,其包括在覆盖所有源语句子序列的最小区间之外但与区间接近的至少一个语句。在假设当前正在输入或将要输入可能当前语句的目标语言的译文的情况下,减少输入的外码的歧义。
-
公开(公告)号:CN106326300A
公开(公告)日:2017-01-11
申请号:CN201510382448.9
申请日:2015-07-02
Applicant: 富士通株式会社
IPC: G06F17/30
CPC classification number: G06F16/355
Abstract: 本公开提供一种信息处理方法和信息处理设备。该信息处理方法包括:将预定文本数据库中包括的关键词关联到预定语义知识数据库中,其中,关联到预定语义知识数据库中的关键词作为第一关键词构成第一关键词集合;计算第二关键词集合中的各个第二关键词与每个所述第一关键词之间的相似度,其中所述第二关键词集合由预定文本数据库中未关联到预定语义知识数据库中的第二关键词构成;以及根据第二关键词与各个第一关键词之间的相似度,将第一关键词在预定语义知识数据库中具有的可传递语义关系应用于该第二关键词。根据本公开的信息处理设备和信息处理方法能够容易、准确地将文本数据库中的关键词关联到预定语义知识库中。
-
-
-
-
-
-
-
-