-
公开(公告)号:CN103366165A
公开(公告)日:2013-10-23
申请号:CN201210091193.7
申请日:2012-03-30
Applicant: 富士通株式会社
CPC classification number: G06T7/0085 , G06K9/3208 , G06K9/3233 , G06T7/12 , G06T7/136 , G06T2207/20164 , H04N1/00681
Abstract: 本发明提供了图像处理装置、图像处理方法以及设备,以至少提高在针对文档所捕获的图像所进行的图像处理中的文档角点提取精度。图像处理装置包括:用于提取文档的沿第一方向的边界线和粗测文档角点的提取单元,其中,第一方向是文档图像的水平方向或垂直方向;用于在粗测文档角点附近、在沿第一方向的边界线上确定候选页角点的确定单元;以及用于在候选页角点中确定文档的文档角点的选择单元。图像处理方法用于执行能够实现上述图像处理装置的功能的处理。上述设备包括上述图像处理装置。应用本发明的上述技术,能够提取到较精确的文档角点,获得较好的图像处理效果,可以应用于图像处理领域。
-
公开(公告)号:CN102193941B
公开(公告)日:2013-09-18
申请号:CN201010124847.2
申请日:2010-03-12
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本发明涉及一种数据处理装置和为值串形式索引值建立索引的索引方法。该数据处理装置包括为值串形式的索引值建立前缀树索引的索引部分,索引部分包括:中间索引值获取单元,用于将索引值补位到预定长度,并基于补位后的各索引值的相应位以及相应位的组合来获取中间索引值;中间索引项产生单元,用于产生针对中间索引值的索引数据作为中间索引数据,并建立中间索引值与中间索引数据之间的对应关系,中间索引数据是中间索引值覆盖的各索引值的索引数据或索引数据的变形的集合;在该集合中,索引数据或索引数据的变形按照与索引值的各位相关的预定顺序排列,且每一个索引值的索引数据或索引数据的变形各自包含表示本身在何处结束的结束标志。
-
公开(公告)号:CN103294730A
公开(公告)日:2013-09-11
申请号:CN201210055854.0
申请日:2012-03-05
Applicant: 富士通株式会社
Abstract: 本申请提供了一种数据推送系统及方法。其中,确定主用户下各个子用户的权重,并且,提取各个子用户的特征;将各个子用户的特征用各个子用户的权重加权,作为主用户的相应特征;根据主用户的特征在待推送数据中确定匹配的推送数据;在主用户的页面上推送所述匹配的推送数据。该数据推送系统及方法,能够实现在微博等SNS系统中进行广告等数据的准确推送。
-
公开(公告)号:CN103294729A
公开(公告)日:2013-09-11
申请号:CN201210055852.1
申请日:2012-03-05
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 提供一种处理、预测包含样本点的时间序列的方法和设备。该处理包含样本点的时间序列的方法包括:确定每个历史时间序列/当前时间序列中的每个样本点在每个历史时间序列/当前时间序列中的相对位置;将每个历史时间序列/当前时间序列中的每个样本点编码为能够反映其在每个历史时间序列/当前时间序列中的相对位置的编码;根据编码后的历史时间序列与编码后的当前时间序列之间的相似度,从编码后的历史时间序列中选择参考时间序列;以及通过统计参考时间序列中的编码的平均值和标准差,来确定参考时间序列中的编码在参考时间序列中的分布函数,其中,参考时间序列和分布函数用于预测当前时间序列中的下一样本点。
-
公开(公告)号:CN101964059B
公开(公告)日:2013-09-11
申请号:CN200910161237.7
申请日:2009-07-24
Applicant: 富士通株式会社
Abstract: 公开了构建级联分类器的方法、识别对象的方法以及装置。该方法包括:基于第一级样本集来构建第一级节点分类器作为临时级联分类器,循环执行以下步骤:基于下级样本集来构建下级节点分类器,下级样本集是上级样本集中针对上级节点分类器的上级识别分数小于与上级节点分类器相对应的上级识别分数阈值与大于或等于0的识别分数阈值偏量之和的样本的集合;将下级节点分类器与临时级联分类器级联以构建新的临时级联分类器;比较增加该下级节点分类器前后的临时级联分类器的识别精度;如果增加下级节点分类器后识别精度不变或降低,则将删除下级节点分类器后的临时级联分类器确定为最终的级联分类器并终止循环,否则继续构建下一个下级节点分类器。
-
公开(公告)号:CN102270201B
公开(公告)日:2013-07-17
申请号:CN201010192559.0
申请日:2010-06-01
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本发明公开了一种用于网络文件的多维索引的方法和设备,其中为文档建立索引的方法包括:识别构成所述文档的特征;将所述特征中的每一个的维度分类为主维度、次维度和附加维度中之一;针对所述主维度的特征和所述次维度的特征建立扩展的倒排索引,所述扩展的倒排索引中包含所述次维度的特征;针对所述附加维度的特征建立倒排索引;将针对所述主维度的特征和所述次维度的特征建立的扩展的倒排索引与针对所述附加维度的特征建立的倒排索引相结合,得到复合索引;以及将所述复合索引存储到索引储存库中,其中,针对主维度的特征和次维度的特征建立扩展的倒排索引包括:针对所述主维度的特征建立一维索引,并且在所述一维索引中附加所述次维度的特征。
-
-
公开(公告)号:CN103116575A
公开(公告)日:2013-05-22
申请号:CN201110379623.0
申请日:2011-11-16
Applicant: 富士通株式会社
Abstract: 本发明实施例公开了一种基于层次短语模型的译文词序概率确定方法及装置。该方法包括:确定源语句的候选翻译模式;针对每一候选翻译模式提取用于表征词序概率的特征量;根据预先获得的模型训练结果确定所述特征量的词序概率;根据所述特征量的词序概率,确定所述每一候选翻译模式的词序概率;根据所述候选翻译模式中词序概率的最大值,确定所述源语句的译文词序概率。本发明实施例通过在候选翻译模式中提取表征词序概率的特征量,进而确定源语句的译文词序概率,增加对调序过程的控制,提高了翻译模式选择的正确性,减少了调序错误的出现,由此改善了将源语句转换为目标语言数据处理过程的性能。
-
公开(公告)号:CN103023947A
公开(公告)日:2013-04-03
申请号:CN201110305755.9
申请日:2011-09-23
Applicant: 富士通株式会社
IPC: H04L29/08
Abstract: 本申请提供一种将基于万维网的服务转换成Web服务的方法和设备,该方法包括:获得用户通过浏览器访问万维网网站的基于万维网的服务期间在浏览器与万维网网站之间交互的超文本传输协议HTTP消息序列;根据HTTP消息序列中包含基于万维网的服务的结果的HTTP结果消息及其中的结果参数,分析HTTP消息序列,以识别与HTTP结果消息关联的HTTP请求消息中的参数及其来源,以及与HTTP结果消息关联的HTTP响应消息中的参数及其目的地;以及按照HTTP消息序列中记录的顺序,将与HTTP结果消息关联的HTTP请求消息和HTTP响应消息的序列封装成Web服务,其中,Web服务的输入参数包括来源于浏览器的参数,而Web服务的输出参数包括HTTP结果消息中的结果参数。
-
公开(公告)号:CN103020040A
公开(公告)日:2013-04-03
申请号:CN201110305010.2
申请日:2011-09-27
Applicant: 富士通株式会社
IPC: G06F17/28
Abstract: 本发明提供了一种源语言改写处理方法和设备及机器翻译系统。该改写处理方法包括:对源语言语句中的待处理语句进行语法分析;根据语法分析结果确定待处理语句中的包含子句嵌套结构的语句;基于语法分析结果对所确定的包含子句嵌套结构的语句进行重构,以获得至少一个包含非嵌套子句的语句;以及用所获得的至少一个包含非嵌套子句的语句中的、含有最多非嵌套子句的语句来替换上述包含子句嵌套结构的语句。该处理装置被配置实现上述处理方法中包括的功能。应用本发明的处理方法、设备或系统,能够将一些复合长句降解并重组为若干非复合的子句,降低机器翻译过程中的翻译难度,提高翻译精度和翻译效率。本发明适用于自然语言处理领域。
-
-
-
-
-
-
-
-
-