-
-
公开(公告)号:CN108694198A
公开(公告)日:2018-10-23
申请号:CN201710229239.X
申请日:2017-04-10
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 公开了一种信息收集设备和信息收集方法。该信息收集设备包括:检索单元,被配置成以预定概率选择关键词库,在选择了关键词库的情况下,从关键词库中选择关键词作为当前扩展词以与指定核心词组合进行检索,而在未选择关键词库的情况下,从扩展词库选择扩展词作为当前扩展词以与指定核心词组合进行检索或者仅使用指定核心词进行检索;以及判定单元,被配置成以预定的判定模型判定所检索到的信息是否有用,并将判定有用的信息加入到信息库中。根据本公开的实施例,可以实现信息的自动快速收集。
-
公开(公告)号:CN107291430A
公开(公告)日:2017-10-24
申请号:CN201610197278.1
申请日:2016-03-31
Applicant: 富士通株式会社
IPC: G06F9/44
Abstract: 本公开内容提供一种命名方法和命名系统。根据本公开内容的一种实施方式的命名方法包括:从编程参考手册或软件说明书获取变量或函数的名称以及与所述名称对应的描述文档,建立所述变量或函数的名称与所述描述文档的二元组;获取待命名的变量或函数的描述文档;确定所述二元组中与所获取的描述文档相似的描述文档的集合;以及根据所述变量或函数的名称与所述描述文档的二元组,提供所述相似的描述文档的集合中的每个描述文档所对应的变量或函数的名称,作为待命名的变量或函数的候选名称。与现有技术相比,本公开内容提出的方法和系统提高代码的维护效率。
-
公开(公告)号:CN107133237A
公开(公告)日:2017-09-05
申请号:CN201610112405.3
申请日:2016-02-29
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 公开了一种图像链接方法和图像链接设备,其中该图像链接方法包括:在图像的标签中查找与语义知识库中的本体存在无歧义关联的无歧义标签;针对每个无歧义标签,查找与其相似性高的近似标签,并且计算该无歧义标签与每个近似标签之间的语义相似度;基于无歧义标签与本体的无歧义关联关系和语义相似度,计算图像与本体的关联值;如果图像与本体的关联值大于等于第一阈值,将该本体判定为存在真实关联的本体;基于语义知识库中已有的包含存在真实关联的本体的语义关系组,判断是否将图像关联到存在真实关联的本体,并且根据判断结果来执行关联操作。根据本公开的实施例,能够利用图像的标签信息将图像链接到语义知识库。
-
公开(公告)号:CN106980390A
公开(公告)日:2017-07-25
申请号:CN201610031192.1
申请日:2016-01-18
Applicant: 富士通株式会社
CPC classification number: G06F3/0233 , G06F17/289
Abstract: 公开了一种辅助翻译输入方法和辅助翻译输入设备。该辅助翻译输入方法包括:输入由第一语言的一个或多个词的拼音表示构成的拼音串;将拼音串转换成以第一语言表示的第一语言文字串;利用从第一语言的拼音表示到第二语言的文字串的统计机器翻译模型,以词为单位对拼音串和第一语言文字串两者进行处理,得到翻译后的以第二语言表示的第二语言文字串,统计机器翻译模型包括从第一语言的拼音表示到第二语言的文字串的多条翻译规则、基于第一语言的第一语言模型以及基于第二语言的第二语言模型,多条翻译规则至少包括从第一语言的拼音表示到第一语言的文字串的转换及其转换概率。根据本公开的实施例,能够进行容错的翻译。
-
公开(公告)号:CN106940702A
公开(公告)日:2017-07-11
申请号:CN201610006846.5
申请日:2016-01-05
Applicant: 富士通株式会社
Abstract: 本发明公开了一种连接短文本中实体提及与语义知识库中实体的方法和设备。该方法包括:从语义知识库中的实体中,选择与短文本中的实体提及相关的候选实体;确定候选实体和实体提及所属的类别;确定实体提及所属的类别的最具区分性的属性集合;基于该属性集合,计算属于该类别的候选实体与实体提及的相似度;以及基于所述相似度,选择候选实体与实体提及连接。
-
公开(公告)号:CN103914447B
公开(公告)日:2017-04-19
申请号:CN201310008659.7
申请日:2013-01-09
Applicant: 富士通株式会社
IPC: G06F17/28
Abstract: 本公开涉及信息处理设备和信息处理方法。信息处理设备包括:互译关系获取单元,其获取双语平行语料中语料在两种语言之间的互译关系;名词性成分确定单元,其对语料在第二语言中进行词性标注,并确定语料在两种语言中的名词性成分和非名词性成分;归一化单元,其将语料在两种语言中的名词性成分替换为指代符号,从而形成在两种语言中的结构化语料;结构化模式生成单元,其生成两种语言之间的结构化模式;和短语化模式生成单元,其生成两种语言之间的短语化模式。通过根据公开的信息处理设备和信息处理方法,可以提供两种语言之间的结构化模式和短语化模式,从而有可能更好地在两种语言之间转换语料。
-
公开(公告)号:CN104111917B
公开(公告)日:2017-04-12
申请号:CN201310138955.9
申请日:2013-04-19
Applicant: 富士通株式会社
IPC: G06F17/28
CPC classification number: G06F17/28
Abstract: 本发明提供了数据处理装置、数据处理方法以及电子设备,以克服现有的语言数据处理技术所存在的处理精度不高的问题。上述数据处理装置包括:语义角色标注单元,用于对源语言语句以及作为其译文的候选调序结果的多个目标语言语句分别进行语义角色标注,以获得源语言语义角色序列以及多个目标语言语义角色序列;匹配单元,用于基于预定双语语料库获得上述源语言语义角色序列分别与每个上述目标语言语义角色序列之间的匹配分数;以及调序结果确定单元,用于将匹配分数最高的目标语言语义角色序列对应的候选调序结果确定为最终调序结果。本发明的上述技术能够应用于数据处理领域。
-
公开(公告)号:CN106484724A
公开(公告)日:2017-03-08
申请号:CN201510547792.9
申请日:2015-08-31
Applicant: 富士通株式会社
IPC: G06F17/30
CPC classification number: G06F16/9535
Abstract: 本公开提供了信息处理装置和信息处理方法。该信息处理装置包括:信息获取单元,其从信息源获取多条与关注对象有关的各自带有时间标签的信息;序列生成单元,其基于所述时间标签生成所述信息的时序序列;波峰检测单元,其针对所述时序序列进行检测,以获得所述时序序列的波峰时段;以及对象事件检测单元,其对所述波峰时段中的信息进行检测,以得到与所述关注对象有关的事件。所述对象事件检测单元包括:聚类单元,其针对所述时序序列的每个波峰时段,对该波峰时段中的信息进行聚类;以及时段事件检测单元,其针对每个波峰时段,基于所述聚类单元的聚类结果中包含信息条数最多的簇内的信息,检测与该波峰时段有关的事件。
-
公开(公告)号:CN103885933B
公开(公告)日:2017-03-01
申请号:CN201210564243.9
申请日:2012-12-21
Applicant: 富士通株式会社
IPC: G06F17/27
Abstract: 本发明公开了一种用于评价文本的情感度的方法和设备。所述用于评价文本的情感度的方法包括:从待评价的文本中抽取目标词和观点词;在包括有目标词簇与观点词之间的情感关系的情感语义图中,搜索与所抽取的目标词对应的或者在语义上最相近的目标词簇,搜索与所述目标词簇相关联的所述观点词;根据所述情感语义图中的所述目标词簇与所述观点词之间的情感强度和情感极性,计算所述待评价的文本的情感度。
-
-
-
-
-
-
-
-
-