文档处理方法和文档处理装置

    公开(公告)号:CN103164390A

    公开(公告)日:2013-06-19

    申请号:CN201110421595.4

    申请日:2011-12-15

    Inventor: 葛乃晟 孟遥 于浩

    Abstract: 本发明提供了一种文档处理方法和装置。文档处理方法包括:根据专业名词及搭配双语语料库,判定专业文档中的使用不准确的专业名词,并对使用不准确的专业名词进行修正;以及根据专业名词及搭配双语语料库,判定专业文档中的使用不准确的名词搭配,并对使用不准确的名词搭配进行修正;其中,专业文档为采用目标语言的单语文档,上述双语包括目标语言和原始语言。文档处理装置被配置实现上述文档处理方法中包括的功能。应用本发明的文档处理方法和文档处理装置,可以适用于不同特定专业领域的专业文档处理。

    信息抽取方法和装置
    32.
    发明授权

    公开(公告)号:CN102073653B

    公开(公告)日:2013-06-19

    申请号:CN200910226105.8

    申请日:2009-11-20

    Abstract: 本发明公开了一种信息抽取方法和装置。其中该信息抽取方法包括:a)获取第一评价信息的初始种子;b)确定与第一评价信息的种子关联的第二评价信息;c)根据与第一评价信息的种子关联出现的第二评价信息的权重来确定新的第二评价信息的种子;d)确定与第二评价信息的种子关联的第一评价信息;e)根据与第二评价信息的种子关联出现的第一评价信息的权重来确定新的第一评价信息的种子;f)判断是否满足迭代结束条件,如果否,则又执行步骤b)至e),否则输出所获得的第一评价信息和第二评价信息。此外,本发明还公开了一种相应的信息抽取装置。

    提取相似子时间序列的方法和装置

    公开(公告)号:CN102880621A

    公开(公告)日:2013-01-16

    申请号:CN201110203979.9

    申请日:2011-07-14

    Abstract: 本发明涉及用于从时间序列提取与基准序列相似的子时间序列的方法和装置。其中,用于从时间序列提取与基准序列相似的子时间序列的方法包括:分别根据时间序列和基准序列的变化趋势对时间序列和基准序列进行变换;将变换后的时间序列分割成多个子时间序列;针对多个子时间序列中的每个子时间序列,计算每个子时间序列与变换后的基准序列之间的编辑距离;以及根据计算出的编辑距离从多个子时间序列中提取与基准序列相似的子时间序列。

    一种分批聚类方法和系统
    34.
    发明公开

    公开(公告)号:CN102867006A

    公开(公告)日:2013-01-09

    申请号:CN201110189562.1

    申请日:2011-07-07

    Abstract: 本发明实施例提供一种分批聚类方法和系统,所述方法包括:按照预定策略对要聚类的文档进行分批;对分批后的每一批文档进行聚类,得到每一批文档的聚类结果;对每一批文档的聚类结果进行凝聚性处理,得到每一批文档的凝聚性处理结果;将除第一批文档以外的每一批文档的凝聚性处理结果中的每一类与上一批文档的凝聚性处理结果中的类合并,得到所述要聚类的文档的分批聚类结果。本实施例的分批聚类方法,通过对要聚类的文档进行分批聚类、批聚类结果的凝聚性处理以及批凝聚性处理结果的合并,提高了聚类性能,实现了增量式的聚类。

    对来自传感器网络的数据包进行同步的装置和方法

    公开(公告)号:CN102857333A

    公开(公告)日:2013-01-02

    申请号:CN201110190236.2

    申请日:2011-06-28

    Abstract: 一种对来自传感器网络的数据包进行同步的装置和方法。该装置包括:输入单元,其被配置为从至少两个传感器接收带有时间戳的数据包;输出时间确定单元,其被配置为将每个数据包的时间戳指示的时间与时延的和确定为数据包的最早输出时间,该时延取决于希望的数据包到达率;以及输出单元,其被配置为在存在最早输出时间早于当前时间的未输出数据包的情况下,按照时间戳指示的时间从早到晚的顺序输出这些未输出数据包。

    一种平行语料资源获取方法及系统

    公开(公告)号:CN102591857A

    公开(公告)日:2012-07-18

    申请号:CN201110021725.5

    申请日:2011-01-10

    Abstract: 本发明实施例公开了一种平行语料资源获取方法及系统。一种平行语料资源获取方法包括:获取第一语料库和第二语料库之间相匹配的中间语言公共字串;根据所获取的公共字串,构成第一语言与第二语言的互译文本对,所述互译文本对用于形成第一语言与第二语言的平行语料资源;其中,所述第一语料库中包括第一语言与中间语言的平行语料;所述第二语料库中包括第二语言与中间语言的平行语料。应用本发明实施例所提供的方案,利用第三方语言来获取两种语言之间的平行语料,以解决语言之间语料资源稀缺的问题,并且有利于获得较高质量的翻译规则以构建统计机器翻译系统。

    用于网络文件的多维索引的方法和设备

    公开(公告)号:CN102270201A

    公开(公告)日:2011-12-07

    申请号:CN201010192559.0

    申请日:2010-06-01

    Abstract: 本发明公开了一种用于网络文件的多维索引的方法和设备,其中为文档建立索引的方法包括:识别构成所述文档的特征;将所述特征中的每一个的维度分类为主维度、次维度和附加维度中之一;针对所述主维度的特征和所述次维度的特征建立扩展的倒排索引,所述扩展的倒排索引中包含所述次维度的特征;针对所述附加维度的特征建立倒排索引;将针对所述主维度的特征和所述次维度的特征建立的扩展的倒排索引与针对所述附加维度的特征建立的倒排索引相结合,得到复合索引;以及将所述复合索引存储到索引储存库中。

    情感倾向性分析方法和装置

    公开(公告)号:CN102236636A

    公开(公告)日:2011-11-09

    申请号:CN201010157784.0

    申请日:2010-04-26

    Abstract: 本发明公开了一种用于分析对研究对象的情感倾向性的方法和装置。所述方法包括:获取粗粒度的情感倾向性;获取细粒度的情感倾向性;以及将粗粒度的情感倾向性和细粒度的情感倾向性结合,获取对该研究对象的情感倾向性;其中获取细粒度的情感倾向性的步骤包括:基于在句子粒度或者段落粒度上确定的与主题词相关的情感词进行情感倾向性分析;其中获取粗粒度的情感倾向性的步骤包括:基于在段落粒度或者文档粒度上确定的与主题词相关的情感词进行情感倾向性分析。

    云服务系统及其中管理用户权限的方法

    公开(公告)号:CN102195956A

    公开(公告)日:2011-09-21

    申请号:CN201010131235.6

    申请日:2010-03-19

    Abstract: 云服务系统及其中管理用户权限的方法。云服务系统包括:用户登录服务器,响应于用户登录确定用户的一或多个角色;权限管理服务器,包括一或多个判断逻辑,其每个对应于一个指定角色、应用、操作和判断逻辑的应用访问规则,对于每个应用访问规则,所指定的判断逻辑能够根据预定条件确定充当所指定的角色的用户是否被允许在所指定的应用中执行所指定的操作;应用访问控制服务器,响应于角色的确定而确定指定有角色的一或多个应用访问规则,并且请求权限管理服务器执行应用访问规则所指定的判断逻辑;应用管理服务器,响应于判断逻辑的确定结果生成有关允许用户使用的应用及操作的信息;及应用前端服务器,根据信息向用户呈现相应应用及操作。

    网页下载的方法和装置
    40.
    发明公开

    公开(公告)号:CN102163203A

    公开(公告)日:2011-08-24

    申请号:CN201010120118.X

    申请日:2010-02-24

    Abstract: 本发明提供了网页下载的方法和装置。所述方法包括:选取步骤,从多个网页中选取至少一个列表页面;模板生成步骤,根据所述至少一个列表页面中的一个或多个来生成列表页面模板;下载更新步骤,利用所述列表页面模板和所述至少一个列表页面来下载和/或更新所述至少一个列表页面中所包含的主题的主题页面。根据本发明的网页下载的方法和装置,可以针对具有多个结构相似的网页的网站进行高效、自动的网页下载。

Patent Agency Ranking