-
公开(公告)号:CN102654881B
公开(公告)日:2014-10-22
申请号:CN201110056065.4
申请日:2011-03-03
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 提供了用于名称消岐聚类的装置和方法。对名称训练集进行数据处理的装置包括:用于确定至少两个名称训练集中每个名称训练集的代表相似度的装置,代表相似度为名称训练集中的文本间相似度的代表值;用于针对至少两个名称训练集中的每个名称训练集,采用不同的相似度阈值进行聚类以选择使聚类效果较佳的相似度阈值作为优选相似度阈值的装置;以及用于根据至少两个名称训练集中的每个名称训练集的代表相似度和优选相似度阈值拟合表示代表相似度与优选相似度阈值之间对应关系的函数的装置。
-
公开(公告)号:CN102073653B
公开(公告)日:2013-06-19
申请号:CN200910226105.8
申请日:2009-11-20
Applicant: 富士通株式会社
Abstract: 本发明公开了一种信息抽取方法和装置。其中该信息抽取方法包括:a)获取第一评价信息的初始种子;b)确定与第一评价信息的种子关联的第二评价信息;c)根据与第一评价信息的种子关联出现的第二评价信息的权重来确定新的第二评价信息的种子;d)确定与第二评价信息的种子关联的第一评价信息;e)根据与第二评价信息的种子关联出现的第一评价信息的权重来确定新的第一评价信息的种子;f)判断是否满足迭代结束条件,如果否,则又执行步骤b)至e),否则输出所获得的第一评价信息和第二评价信息。此外,本发明还公开了一种相应的信息抽取装置。
-
公开(公告)号:CN102867006A
公开(公告)日:2013-01-09
申请号:CN201110189562.1
申请日:2011-07-07
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本发明实施例提供一种分批聚类方法和系统,所述方法包括:按照预定策略对要聚类的文档进行分批;对分批后的每一批文档进行聚类,得到每一批文档的聚类结果;对每一批文档的聚类结果进行凝聚性处理,得到每一批文档的凝聚性处理结果;将除第一批文档以外的每一批文档的凝聚性处理结果中的每一类与上一批文档的凝聚性处理结果中的类合并,得到所述要聚类的文档的分批聚类结果。本实施例的分批聚类方法,通过对要聚类的文档进行分批聚类、批聚类结果的凝聚性处理以及批凝聚性处理结果的合并,提高了聚类性能,实现了增量式的聚类。
-
公开(公告)号:CN102857333A
公开(公告)日:2013-01-02
申请号:CN201110190236.2
申请日:2011-06-28
Applicant: 富士通株式会社
Abstract: 一种对来自传感器网络的数据包进行同步的装置和方法。该装置包括:输入单元,其被配置为从至少两个传感器接收带有时间戳的数据包;输出时间确定单元,其被配置为将每个数据包的时间戳指示的时间与时延的和确定为数据包的最早输出时间,该时延取决于希望的数据包到达率;以及输出单元,其被配置为在存在最早输出时间早于当前时间的未输出数据包的情况下,按照时间戳指示的时间从早到晚的顺序输出这些未输出数据包。
-
公开(公告)号:CN102799599A
公开(公告)日:2012-11-28
申请号:CN201110146337.X
申请日:2011-05-27
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本发明实施例公开了用户生成媒体信息的处理方法及装置。一种用户生成媒体信息的处理方法,包括:根据用户的定制规则获得用户生成媒体信息,并根据所述用户的服务级别为所述用户建立数据库,所述数据库中包括所述用户生成媒体信息;根据所述用户的服务级别及为所述用户建立的数据库为所述用户提供信息服务。通过本发明实施例,能够对不同服务级别的用户提供不同的信息服务,满足了用户的个性化需求。
-
公开(公告)号:CN102376057A
公开(公告)日:2012-03-14
申请号:CN201010257490.5
申请日:2010-08-16
Applicant: 富士通株式会社
Abstract: 本发明公开一种对消费者生成媒体信息进行处理的方法和装置。所述方法包括:从信息供应源收集并抽取消费者生成媒体信息;基于预定主题对抽取出的所述消费者生成媒体信息进行过滤,以获得与所述预定主题相关的消费者生成媒体信息;基于用户定制的规则来对过滤得到的消费者生成媒体信息进行整合,以便获得定制的消费者生成媒体信息;以及可视化地呈现所述定制的消费者生成媒体信息,其中,基于用户模型来进行所述收集和过滤中的至少一个,所述用户模型包括关于用户对消费者生成媒体信息的偏好的信息;并且其中,所述方法还包括:根据所述用户对所呈现的消费者生成媒体信息的反馈来更新所述用户模型。
-
公开(公告)号:CN102270201A
公开(公告)日:2011-12-07
申请号:CN201010192559.0
申请日:2010-06-01
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本发明公开了一种用于网络文件的多维索引的方法和设备,其中为文档建立索引的方法包括:识别构成所述文档的特征;将所述特征中的每一个的维度分类为主维度、次维度和附加维度中之一;针对所述主维度的特征和所述次维度的特征建立扩展的倒排索引,所述扩展的倒排索引中包含所述次维度的特征;针对所述附加维度的特征建立倒排索引;将针对所述主维度的特征和所述次维度的特征建立的扩展的倒排索引与针对所述附加维度的特征建立的倒排索引相结合,得到复合索引;以及将所述复合索引存储到索引储存库中。
-
公开(公告)号:CN102236636A
公开(公告)日:2011-11-09
申请号:CN201010157784.0
申请日:2010-04-26
Applicant: 富士通株式会社
IPC: G06F17/27
Abstract: 本发明公开了一种用于分析对研究对象的情感倾向性的方法和装置。所述方法包括:获取粗粒度的情感倾向性;获取细粒度的情感倾向性;以及将粗粒度的情感倾向性和细粒度的情感倾向性结合,获取对该研究对象的情感倾向性;其中获取细粒度的情感倾向性的步骤包括:基于在句子粒度或者段落粒度上确定的与主题词相关的情感词进行情感倾向性分析;其中获取粗粒度的情感倾向性的步骤包括:基于在段落粒度或者文档粒度上确定的与主题词相关的情感词进行情感倾向性分析。
-
公开(公告)号:CN102073653A
公开(公告)日:2011-05-25
申请号:CN200910226105.8
申请日:2009-11-20
Applicant: 富士通株式会社
Abstract: 本发明公开了一种信息抽取方法和装置。其中该信息抽取方法包括:a)获取第一评价信息的初始种子;b)确定与第一评价信息的种子关联的第二评价信息;c)根据与第一评价信息的种子关联出现的第二评价信息的权重来确定新的第二评价信息的种子;d)确定与第二评价信息的种子关联的第一评价信息;e)根据与第二评价信息的种子关联出现的第一评价信息的权重来确定新的第一评价信息的种子;f)判断是否满足迭代结束条件,如果否,则又执行步骤b)至e),否则输出所获得的第一评价信息和第二评价信息。此外,本发明还公开了一种相应的信息抽取装置。
-
公开(公告)号:CN101833555B
公开(公告)日:2016-05-04
申请号:CN200910127243.0
申请日:2009-03-12
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本发明涉及信息提取方法和装置。用于从输入的信息源中提取涉及特定主题的有用信息的信息提取方法,包括:基于描述了各类训练语素的组合概率的分类模板,从所述信息源中定位感兴趣的各类目标语素;按照预定的匹配规则对所述定位的各类目标语素进行匹配,并提取符合所述预定匹配规则的目标语素以组合成描述向量;以及基于所述提取出的描述向量,生成全局性信息以作为所述涉及特定主题的有用信息。
-
-
-
-
-
-
-
-
-