-
公开(公告)号:CN104951478A
公开(公告)日:2015-09-30
申请号:CN201410126767.9
申请日:2014-03-31
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本发明公开了信息处理方法和信息处理装置,该信息处理方法包括:根据预设关键词在多个媒体平台中进行搜索以得到各个媒体平台中与关键词有关的媒体条目集合;针对每个媒体条目集合,计算媒体条目之间的内容重复度,并根据算出的内容重复度对该媒体条目集合中的媒体条目进行整合,以将内容重复度满足预定条件的媒体条目整合为重复集合;从每个重复集合提取关键词,并根据所提取的关键词确定在该重复集合所属的自身媒体平台及其它媒体平台中的相似媒体条目,从而根据相似媒体条目确定话题;以及利用从话题中提取的表示该话题在多个媒体平台间的差异性的特定特征和通过对该话题预先进行标注得到的标注结果,构建用于确定该话题的状态的分类模型。
-
公开(公告)号:CN104951471A
公开(公告)日:2015-09-30
申请号:CN201410124501.0
申请日:2014-03-28
Applicant: 富士通株式会社
Abstract: 本公开提供一种信息处理设备、信息处理方法和电子装置。该信息处理设备包括:网络建立装置,用于根据多个用户中各个用户之间的关系,在各个用户感兴趣的热词之间建立关系,以建立热词关联网络;以及热词排序装置,用于对所述热词关联网络中的热词进行排序。根据本公开的信息处理设备、信息处理方法和电子装置能够通过热词之间的关联确定热词地热度,从而能够更准确地对热词进行排序。
-
公开(公告)号:CN102831131B
公开(公告)日:2015-02-11
申请号:CN201110172092.8
申请日:2011-06-16
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本发明实施例公开了一种构建标注网页语料库的方法及装置,所述方法包括:针对预先选取的初始种子网页生成初始种子标注网页语料;按照初始种子标注网页语料的关键词从搜索引擎中获取预设个数的相关种子网页;按照初始种子网页标注语料对相关种子网页进行标注,得到相关种子标注网页语料;判断相关种子标注网页语料和初始种子标注网页语料是否满足预设条件,如果是,则将相关种子标注网页语料和初始种子标注网页语料组合为标注网页语料库;如果否,则将相关种子标注网页语料作为初始种子标注网页语料,并执行从搜索引擎中获取预设个数的相关种子网页的步骤。通过本发明实施例,能够在给定的少量种子标注语料的情况下,形成大规模的标准标注语料。
-
公开(公告)号:CN102236658B
公开(公告)日:2015-01-14
申请号:CN201010157766.2
申请日:2010-04-26
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本发明公开了一种网页内容提取方法和装置。该网页内容提取装置包括:网页分割部分,被配置成对网页进行分割,得到至少一个布局块;布局块集合生成部分,被配置成在所述布局块中,找出具有相同宽度的布局块,得到至少一个布局块集合,各集合的布局块具有不同的宽度;布局块确定部分,被配置成确定具有最多布局块的布局块集合;内容提取部分,被配置成基于所述具有最多布局块的布局块集合来提取网页内容,其中,所述内容提取部分被配置成:根据布局块在网页中的位置,在所述具有最多布局块的布局块集合中找出首块和尾块;提取所述首块、所述尾块以及位置在所述首块和所述尾块之间的布局块的内容作为所述网页内容。
-
公开(公告)号:CN104239300A
公开(公告)日:2014-12-24
申请号:CN201310223884.2
申请日:2013-06-06
Applicant: 富士通株式会社
IPC: G06F17/30
CPC classification number: G06F16/3334
Abstract: 本发明公开了从文本中挖掘语义关键词的方法和设备。根据本发明的方法包括:在文本中搜索已知词,以得到多个候选关键词;根据所述已知词的参考概率和/或上下文,计算所述多个候选关键词的候选概率,所述参考概率表明所述已知词作为锚文本的可能性,所述候选概率表明所述候选关键词作为语义关键词的可能性;以及根据所述多个候选关键词的候选概率,确定所述多个候选关键词是否为所述文本的语义关键词。
-
公开(公告)号:CN104111917A
公开(公告)日:2014-10-22
申请号:CN201310138955.9
申请日:2013-04-19
Applicant: 富士通株式会社
IPC: G06F17/28
CPC classification number: G06F17/28
Abstract: 本发明提供了数据处理装置、数据处理方法以及电子设备,以克服现有的语言数据处理技术所存在的处理精度不高的问题。上述数据处理装置包括:语义角色标注单元,用于对源语言语句以及作为其译文的候选调序结果的多个目标语言语句分别进行语义角色标注,以获得源语言语义角色序列以及多个目标语言语义角色序列;匹配单元,用于基于预定双语语料库获得上述源语言语义角色序列分别与每个上述目标语言语义角色序列之间的匹配分数;以及调序结果确定单元,用于将匹配分数最高的目标语言语义角色序列对应的候选调序结果确定为最终调序结果。本发明的上述技术能够应用于数据处理领域。
-
公开(公告)号:CN103885933A
公开(公告)日:2014-06-25
申请号:CN201210564243.9
申请日:2012-12-21
Applicant: 富士通株式会社
IPC: G06F17/27
Abstract: 本发明公开了一种用于评价文本的情感度的方法和设备。所述用于评价文本的情感度的方法包括:从待评价的文本中抽取目标词和观点词;在包括有目标词簇与观点词之间的情感关系的情感语义图中,搜索与所抽取的目标词对应的或者在语义上最相近的目标词簇,搜索与所述目标词簇相关联的所述观点词;根据所述情感语义图中的所述目标词簇与所述观点词之间的情感强度和情感极性,计算所述待评价的文本的情感度。
-
公开(公告)号:CN103838559A
公开(公告)日:2014-06-04
申请号:CN201210484672.5
申请日:2012-11-23
Applicant: 富士通株式会社
IPC: G06F9/44
Abstract: 本发明涉及一种用于组合工具的方法和装置。该方法包括以下步骤:基于对各个工具的输入和输出定义的抽象输入类型和抽象输出类型,生成用于各个工具的语义描述文件,其中所定义的抽象输入类型和抽象输出类型构成本体库;将从各个工具中选择的、要组合的多个工具封装成符合工具组合引擎要求的格式;响应于用户操作,将封装后的要组合的多个工具进行组合,并且将所得到的组合传送到工具组合引擎;根据用于要组合的多个工具的多个语义描述文件,利用本体库对组合内的工具之间的输入和输出是否可连接进行判断;以及基于判断的结果,确定组合是否有效。
-
公开(公告)号:CN103678316A
公开(公告)日:2014-03-26
申请号:CN201210320607.9
申请日:2012-08-31
Applicant: 富士通株式会社
CPC classification number: G06F16/951 , G06F17/278
Abstract: 本发明公开了一种实体关系分类装置和实体关系分类方法,所述实体关系分类装置包括特征抽取单元,被配置为抽取输入样本中的实体的特征和实体上下文的特征;分类器,被配置为基于所述特征进行分类,得到以下概率中的至少一部分:所述实体及其特征、所述实体上下文及其特征、各种实体关系的概率,或者前述各项的各种组合的条件概率,其中,所述分类器是基于实体和实体上下文的预定模式构建的;以及实体关系概率计算单元,被配置为基于所得到的各个概率计算在所述实体和所述实体上下文的前提下各种实体关系的概率。
-
公开(公告)号:CN103530583A
公开(公告)日:2014-01-22
申请号:CN201210230536.3
申请日:2012-07-04
Applicant: 富士通株式会社
IPC: G06K7/00
Abstract: 本发明提供了基于RFID标签的定位终端、定位方法、定位系统和电子设备,以至少克服现有的RFID定位技术定位精度低的问题。定位终端包括:第一获得单元,用于获得其中每个RFID训练标签在天线阵列的多个输出功率下被上述天线阵列读取到的次数,天线阵列包含至少一个RFID阅读器;地图构建单元,用于构建关于上述待定位区域的读取概率地图;第二获得单元,用于获得上述RFID待测标签在上述天线阵列的多个输出功率下被上述天线阵列读取到的次数;以及计算单元,用于计算上述RFID待测标签的位置。本发明的上述技术能够提高RFID定位精度,可以用于无线定位领域。
-
-
-
-
-
-
-
-
-