-
公开(公告)号:CN101727451A
公开(公告)日:2010-06-09
申请号:CN200810171185.7
申请日:2008-10-22
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 公开了一种信息提取方法和装置,用于从输入的信息源中提取涉及特定主题的有用信息。该方法包括:参考预先设定的第一资源,从信息源中查找并定位所有感兴趣的各类目标语素;从信息源中选择出所有包含所找到的各类目标语素的语句;参考预先设定的第二资源,对所选出的所有语句中的各类目标语素依次进行匹配;参考预先设定的描述向量提取规则,基于所述匹配结果,从信息源中提取出涉及特定主题的描述向量;以及基于所述描述向量,生成涉及特定主题的全局性信息,即为所述要提取的涉及特定主题的有用信息。在根据本发明的信息提取方法和装置中,无需对信息源进行词语划分和/或语法分析,因此可以较为简单和快速地从信息源中提取出所需的信息。
-
公开(公告)号:CN101520784A
公开(公告)日:2009-09-02
申请号:CN200810080954.2
申请日:2008-02-29
Applicant: 富士通株式会社
IPC: G06F17/30
CPC classification number: G06F17/30867
Abstract: 本发明涉及信息发布服务的系统和方法。所述系统包括:查询条件确定组件,根据用户输入和用户模型构建查询条件,所述用户模型可用于确定用户的特征;搜索组件,用于基于所述查询条件进行查询;查询结果处理组件,对所述搜索组件所得到的查询结果进行处理,向用户提供处理过的信息;以及发布组件,对用户编辑完成的要发布的信息进行发布。
-
公开(公告)号:CN1928862A
公开(公告)日:2007-03-14
申请号:CN200510102518.7
申请日:2005-09-08
Applicant: 富士通株式会社
Abstract: 本发明为基于数据挖掘获取词或词组单元译文信息的系统和方法。包括:输入装置,用于输入词或词组单元;候选译文统计装置,根据输入所述的词或词组单元收集有效的电子文档和网页,在此基础上构建候选译文、发现候选译文的边界、统计候选译文的特征;候选译文噪声处理装置,用于对所述候选译文统计装置形成的噪声进行识别和处理;候选译文评价装置,根据所述候选译文统计装置得到的候选译文的特征,对每个可能的候选译文进行评价排序;候选译文典型例句挖掘装置,用于在Web上挖掘出候选译文的典型例句,并根据其典型程度排序;输出装置。使用户输入任意词典未收录的词或词组单元系统返回在另一种语言中按权值大小排列的翻译候选列表及其典型用法。
-
公开(公告)号:CN104102650B
公开(公告)日:2017-08-22
申请号:CN201310118185.1
申请日:2013-04-07
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本发明提供了内容提供装置、内容提供方法以及电子设备,以克服现有的用于向用户提供内容的技术所提供的内容与用户的兴趣匹配度较低的问题。内容提供装置包括:获得单元,用于根据当前用户的浏览历史记录获得当前用户的浏览偏好分布,其中,浏览偏好分布用于反映相应的用户分别对各内容类别的关注度;类别确定单元,用于至少基于当前用户的浏览偏好分布来确定至少一个内容类别;以及结果确定单元,用于将与上述至少一个内容类别对应的记录内容确定为搜索结果提供给当前用户。内容提供方法用于执行能够实现内容提供装置的功能的处理。电子设备包括上述内容提供装置。本发明的上述技术能够应用于信息处理领域。
-
公开(公告)号:CN103678418B
公开(公告)日:2017-06-06
申请号:CN201210362152.7
申请日:2012-09-25
Applicant: 富士通株式会社
Abstract: 公开了信息处理方法和信息处理设备,该方法包括:候选语义关键词提取步骤,用于对输入文本进行分词以从文本提取候选语义关键词;权重计算步骤,用于计算提取的候选语义关键词的权重;语义关键词选择步骤,用于基于算出的权重,根据预定规则从提取的候选语义关键词中选择语义关键词;链接关系确定步骤,用于确定选择的语义关键词与预定语义知识库中的概念间的链接关系;及文本语义图构建步骤,用于基于确定的链接关系、语义知识库中的概念间的语义关系及根据预定推理规则确定的语义关键词与语义知识库中其他概念间的关系,构建表示文本中的语义关键词与语义知识库中的概念间的关系的文本语义图。根据本发明,能够高效地进行信息集成、检索和共享。
-
公开(公告)号:CN104035916B
公开(公告)日:2017-05-24
申请号:CN201310072432.9
申请日:2013-03-07
Applicant: 富士通株式会社
Abstract: 本发明公开了标准化标注工具的方法和设备。根据本发明的标准化标注工具的方法包括:选择与待标准化的非标准工具对应的标准工具;对于所述非标准工具的每一个输出标注类,计算其与所述标准工具的每一个输出标注类的相似度,所述输出标注类表明被标注对象所属的类别;和/或对于所述非标准工具的每一个输出标注属性,计算其与所述标准工具的每一个输出标注属性的相似度,所述输出标注属性表明所述被标注对象所具有的属性;以及根据所述输出标注类的相似度和/或所述输出标注属性的相似度,确定所述非标准工具的标记和所述标准工具的标记之间的对应关系。
-
公开(公告)号:CN103729530B
公开(公告)日:2017-05-24
申请号:CN201210391204.3
申请日:2012-10-15
Applicant: 富士通株式会社
IPC: G06F19/00
Abstract: 本发明涉及一种对序列进行处理的装置和方法。对序列进行处理的装置包括:划分单元,被配置用于以多个不同的子序列长度,分别将序列划分为多个子序列;相似度计算单元,被配置用于针对每一个子序列长度,计算每两个子序列之间的相似度;周期确定单元,被配置用于确定使相似度的平均值最大的子序列长度作为序列的周期;识别单元,被配置用于在与周期对应的多个子序列中识别异常子序列;以及校正单元,被配置用于对异常子序列进行校正以获得新的序列。
-
公开(公告)号:CN103678316B
公开(公告)日:2017-03-01
申请号:CN201210320607.9
申请日:2012-08-31
Applicant: 富士通株式会社
Abstract: 本发明公开了一种实体关系分类装置和实体关系分类方法,所述实体关系分类装置包括特征抽取单元,被配置为抽取输入样本中的实体的特征和实体上下文的特征;分类器,被配置为基于所述特征进行分类,得到以下概率中的至少一部分:所述实体及其特征、所述实体上下文及其特征、各种实体关系的概率,或者前述各项的各种组合的条件概率,其中,所述分类器是基于实体和实体上下文的预定模式构建的;以及实体关系概率计算单元,被配置为基于所得到的各个概率计算在所述实体和所述实体上下文的前提下各种实体关系的概率。
-
公开(公告)号:CN103294730B
公开(公告)日:2017-03-01
申请号:CN201210055854.0
申请日:2012-03-05
Applicant: 富士通株式会社
Abstract: 本申请提供了一种数据推送系统及方法。其中,确定主用户下各个子用户的权重,并且,提取各个子用户的特征;将各个子用户的特征用各个子用户的权重加权,作为主用户的相应特征;根据主用户的特征在待推送数据中确定匹配的推送数据;在主用户的页面上推送所述匹配的推送数据。该数据推送系统及方法,能够实现在微博等SNS系统中进行广告等数据的准确推送。
-
公开(公告)号:CN103678318B
公开(公告)日:2016-12-21
申请号:CN201210320806.X
申请日:2012-08-31
Applicant: 富士通株式会社
Abstract: 本申请公开了一种多词单元提取方法和设备及人工神经网络训练方法和设备。提取多词单元的方法包括:针对将语句进行分词得到的多个分词块中的每个分词块,获取每个分词块中的分词的语言学特征作为特征量;将特征量作为参数输入到人工神经网络中;采用人工神经网络计算每个分词块中的分词是多词单元的一部分的第一可能性和该分词不是多词单元的一部分的第二可能性,并且根据第一和第二可能性判断该分词是否为多词单元的一部分;提取相邻的两个或更多个被判断为多词单元的一部分的分词以形成多词单元;以及获取与当前分词块相邻的先前分词块的判断的结果作为反馈信息,并且将反馈信息也作为当前分词块中的分词的特征量。
-
-
-
-
-
-
-
-
-