图像增强方法和设备
    52.
    发明授权

    公开(公告)号:CN101814179B

    公开(公告)日:2012-06-27

    申请号:CN200910005695.1

    申请日:2009-02-19

    Abstract: 本发明提供了一种图像增强方法和设备,其中该图像增强方法包括以下步骤:计算图像中每个像素的全漫射亮度;根据计算出的每个像素的全漫射亮度,将每个像素分类为高亮像素或非高亮像素;以及对于每个非高亮像素,根据其全漫射亮度来增强其饱和度。根据上述技术方案,可以有效地提高诸如白板图像这样的图像的可视性和/或可读性。

    机器学习方法和装置

    公开(公告)号:CN102402713A

    公开(公告)日:2012-04-04

    申请号:CN201010280239.0

    申请日:2010-09-09

    Abstract: 本发明公开了一种机器学习方法和装置。所述机器学习方法包括:利用不同的方法从未标注的数据集中自动标注和获取n个不同的种子集合S1,S2,...,Sn,n是自然数且n≥2;利用所述n个已自动标注的种子集合S1,S2,...,Sn分别训练相应的n个分类器C1,C2,...,Cn;对于所述n个已自动标注的种子集合中的每个种子集合Si,i=1,2,...,n,利用所述n个分类器中的除由该种子集合Si训练的分类器Ci之外的部分或全部分类器对该种子集合Si进行验证;以及利用经验证的所述n个种子集合S1,S2,...,Sn分别再次训练所述相应的n个分类器C1,C2,...,Cn。

    形成用于生成文档模板的合并树的方法以及装置

    公开(公告)号:CN102375847A

    公开(公告)日:2012-03-14

    申请号:CN201010260747.2

    申请日:2010-08-17

    Abstract: 本发明涉及一种形成用于生成文档模板的合并树的方法以及装置,所述方法包括以下步骤:相似度计算步骤,用于当从由多个页面解析成的多棵树中每颗树与另一颗树进行比较时计算两颗被比树中位于同一层的子树的相似度,以从两颗被比树中提取相似度大于或等于预定第一阈值的相似子树和该些相似子树的公共根节点,其中从所述多棵树的节点能够提取所需特征;合并步骤,使用提取的所有树的相似子树来形成初始合并树,其中初始合并树的根节点是所有树的相似子树的公共根节点;以及后处理步骤,用于对初始合并树进行后处理,以通过去除初始合并树的无效子树来获得合并树。

    识别网页节点类型的方法和装置

    公开(公告)号:CN102375829A

    公开(公告)日:2012-03-14

    申请号:CN201010254598.9

    申请日:2010-08-13

    Abstract: 本发明涉及一种识别网页节点类型的方法和装置。其中,将网页转换为网页节点的序列,并利用适于序列化对象的分类器对所述序列中的网页节点进行分类,从而获得网页节点的候选类型。根据本发明的实施方式,能够识别网页节点的类型,从而有助于网页内容的抽取。

    获取内容彼此相对应的多种语言文本的装置和方法

    公开(公告)号:CN102375824A

    公开(公告)日:2012-03-14

    申请号:CN201010253505.0

    申请日:2010-08-12

    Inventor: 孟遥 刘汝杰 于浩

    Abstract: 公开了一种用于获取内容彼此相对应的多种语言文本的装置,包括:关键图像生成单元,其被配置为生成与待获取的多种语言文本的内容相关的关键图像;和文本获取单元,其被配置为确定预定的信息源中与该关键图像相匹配的关键图像匹配信息,并根据预定规则从该关键图像匹配信息提取得到内容彼此相对应的多种语言文本。还公开一种用于获取内容彼此相对应的多种语言文本的方法。根据本发明实施例的解决方案可以改善所获取的多种语言对齐文本的精确度,此外还能够提高获取多种语言对齐文本的效率。

    网页内容提取方法和装置
    57.
    发明公开

    公开(公告)号:CN102236658A

    公开(公告)日:2011-11-09

    申请号:CN201010157766.2

    申请日:2010-04-26

    Abstract: 本发明公开了一种网页内容提取方法和装置。该网页内容提取装置包括:网页分割部分,被配置成对网页进行分割,得到至少一个布局块;布局块集合生成部分,被配置成在所述布局块中,找出具有相同宽度的布局块,得到至少一个布局块集合,各集合的布局块具有不同的宽度;布局块确定部分,被配置成确定具有最多布局块的布局块集合;内容提取部分,被配置成基于所述具有最多布局块的布局块集合来提取网页内容。

    用于选择用于网络发布的关键词的方法和设备

    公开(公告)号:CN102214173A

    公开(公告)日:2011-10-12

    申请号:CN201010142083.X

    申请日:2010-04-02

    Abstract: 本发明公开了用于选择用于网络发布的关键词的方法和设备。一种用于选择用于网络发布的关键词的方法,包括:获取关键词集合中的关键词的费用信息和关注度信息;对于该关键词集合中的每个关键词,基于该关键词的费用信息和关注度信息,计算该关键词的性价比指标值;以及基于该关键词集合中的各个关键词的性价比指标值,从该关键词集合中选择用于网络发布的关键词或关键词的组合。本发明能够帮助用户选择有效且成本低的关键词或关键词的组合。

    信息发布系统和信息发布方法

    公开(公告)号:CN101520784B

    公开(公告)日:2011-09-28

    申请号:CN200810080954.2

    申请日:2008-02-29

    Inventor: 夏迎炬 于浩 邹纲

    CPC classification number: G06F17/30867

    Abstract: 本发明涉及信息发布服务的系统和方法。所述系统包括:查询条件确定组件,根据用户输入和用户模型构建查询条件,所述用户模型可用于确定用户的特征;搜索组件,用于基于所述查询条件进行查询;查询结果处理组件,对所述搜索组件所得到的查询结果进行处理,向用户提供处理过的信息;以及发布组件,对用户编辑完成的要发布的信息进行发布。

Patent Agency Ranking