信息抽取方法和装置
    161.
    发明授权

    公开(公告)号:CN102073653B

    公开(公告)日:2013-06-19

    申请号:CN200910226105.8

    申请日:2009-11-20

    Abstract: 本发明公开了一种信息抽取方法和装置。其中该信息抽取方法包括:a)获取第一评价信息的初始种子;b)确定与第一评价信息的种子关联的第二评价信息;c)根据与第一评价信息的种子关联出现的第二评价信息的权重来确定新的第二评价信息的种子;d)确定与第二评价信息的种子关联的第一评价信息;e)根据与第二评价信息的种子关联出现的第一评价信息的权重来确定新的第一评价信息的种子;f)判断是否满足迭代结束条件,如果否,则又执行步骤b)至e),否则输出所获得的第一评价信息和第二评价信息。此外,本发明还公开了一种相应的信息抽取装置。

    提取相似子时间序列的方法和装置

    公开(公告)号:CN102880621A

    公开(公告)日:2013-01-16

    申请号:CN201110203979.9

    申请日:2011-07-14

    Abstract: 本发明涉及用于从时间序列提取与基准序列相似的子时间序列的方法和装置。其中,用于从时间序列提取与基准序列相似的子时间序列的方法包括:分别根据时间序列和基准序列的变化趋势对时间序列和基准序列进行变换;将变换后的时间序列分割成多个子时间序列;针对多个子时间序列中的每个子时间序列,计算每个子时间序列与变换后的基准序列之间的编辑距离;以及根据计算出的编辑距离从多个子时间序列中提取与基准序列相似的子时间序列。

    汉字识别方法和装置
    163.
    发明公开

    公开(公告)号:CN102867178A

    公开(公告)日:2013-01-09

    申请号:CN201110187137.9

    申请日:2011-07-05

    Abstract: 本发明提供一种汉字识别装置和方法,该装置包括:第一识别单元用于对文本图像进行切分和识别,以获得识别信息;错误检测单元,用于利用该第一识别单元获得识别信息中图像单元的位置信息和识别编码信息检测错误切分的图像单元;错误修正单元,用于对该错误检测单元检测出的该错误切分的图像单元进行修正;第二识别单元,用于对该错误修正单元修正后的该图像单元进行识别,以获得相应的识别编码信息。通过本发明实施例,利用对文本图像进行识别后获得的识别信息中的识别编码信息和图像单元位置信息检测错误切分的图像单元并对错误切分的图像单元进行修正,从而可提高识别精度,解决现有技术中存在的问题。

    一种分批聚类方法和系统
    164.
    发明公开

    公开(公告)号:CN102867006A

    公开(公告)日:2013-01-09

    申请号:CN201110189562.1

    申请日:2011-07-07

    Abstract: 本发明实施例提供一种分批聚类方法和系统,所述方法包括:按照预定策略对要聚类的文档进行分批;对分批后的每一批文档进行聚类,得到每一批文档的聚类结果;对每一批文档的聚类结果进行凝聚性处理,得到每一批文档的凝聚性处理结果;将除第一批文档以外的每一批文档的凝聚性处理结果中的每一类与上一批文档的凝聚性处理结果中的类合并,得到所述要聚类的文档的分批聚类结果。本实施例的分批聚类方法,通过对要聚类的文档进行分批聚类、批聚类结果的凝聚性处理以及批凝聚性处理结果的合并,提高了聚类性能,实现了增量式的聚类。

    对来自传感器网络的数据包进行同步的装置和方法

    公开(公告)号:CN102857333A

    公开(公告)日:2013-01-02

    申请号:CN201110190236.2

    申请日:2011-06-28

    Abstract: 一种对来自传感器网络的数据包进行同步的装置和方法。该装置包括:输入单元,其被配置为从至少两个传感器接收带有时间戳的数据包;输出时间确定单元,其被配置为将每个数据包的时间戳指示的时间与时延的和确定为数据包的最早输出时间,该时延取决于希望的数据包到达率;以及输出单元,其被配置为在存在最早输出时间早于当前时间的未输出数据包的情况下,按照时间戳指示的时间从早到晚的顺序输出这些未输出数据包。

    用户生成媒体信息的处理方法及装置

    公开(公告)号:CN102799599A

    公开(公告)日:2012-11-28

    申请号:CN201110146337.X

    申请日:2011-05-27

    Abstract: 本发明实施例公开了用户生成媒体信息的处理方法及装置。一种用户生成媒体信息的处理方法,包括:根据用户的定制规则获得用户生成媒体信息,并根据所述用户的服务级别为所述用户建立数据库,所述数据库中包括所述用户生成媒体信息;根据所述用户的服务级别及为所述用户建立的数据库为所述用户提供信息服务。通过本发明实施例,能够对不同服务级别的用户提供不同的信息服务,满足了用户的个性化需求。

    一种平行语料资源获取方法及系统

    公开(公告)号:CN102591857A

    公开(公告)日:2012-07-18

    申请号:CN201110021725.5

    申请日:2011-01-10

    Abstract: 本发明实施例公开了一种平行语料资源获取方法及系统。一种平行语料资源获取方法包括:获取第一语料库和第二语料库之间相匹配的中间语言公共字串;根据所获取的公共字串,构成第一语言与第二语言的互译文本对,所述互译文本对用于形成第一语言与第二语言的平行语料资源;其中,所述第一语料库中包括第一语言与中间语言的平行语料;所述第二语料库中包括第二语言与中间语言的平行语料。应用本发明实施例所提供的方案,利用第三方语言来获取两种语言之间的平行语料,以解决语言之间语料资源稀缺的问题,并且有利于获得较高质量的翻译规则以构建统计机器翻译系统。

    射频识别标签定位方法和装置

    公开(公告)号:CN102435990A

    公开(公告)日:2012-05-02

    申请号:CN201010505219.9

    申请日:2010-09-29

    Inventor: 陆应亮 于浩

    Abstract: 本发明公开一种射频识别RFID标签定位方法和装置。所述方法包括:使用RFID阅读器的天线分别在多个指定的发射功率下读取线性排列的对象标签预定次数;记录每个对象标签在每一个指定的发射功率下被所述天线成功读取的次数;计算每个对象标签被所述天线成功读取的次数之和;通过对每个对象标签被成功读取的次数之和进行排序,来确定各个对象标签相对于所述天线的排列顺序;计算每个对象标签相对于所述天线的归一化读取概率;以及通过根据每个对象标签相对于所述天线的归一化读取概率查询读取概率地图,来确定每个对象标签相对于所述天线的距离.其中,读取概率地图记录标签相对于天线的归一化读取概率与标签相对于天线的距离的对应关系。

    对消费者生成媒体信息进行处理的方法和装置

    公开(公告)号:CN102376057A

    公开(公告)日:2012-03-14

    申请号:CN201010257490.5

    申请日:2010-08-16

    Abstract: 本发明公开一种对消费者生成媒体信息进行处理的方法和装置。所述方法包括:从信息供应源收集并抽取消费者生成媒体信息;基于预定主题对抽取出的所述消费者生成媒体信息进行过滤,以获得与所述预定主题相关的消费者生成媒体信息;基于用户定制的规则来对过滤得到的消费者生成媒体信息进行整合,以便获得定制的消费者生成媒体信息;以及可视化地呈现所述定制的消费者生成媒体信息,其中,基于用户模型来进行所述收集和过滤中的至少一个,所述用户模型包括关于用户对消费者生成媒体信息的偏好的信息;并且其中,所述方法还包括:根据所述用户对所呈现的消费者生成媒体信息的反馈来更新所述用户模型。

    处理图像的方法和设备
    170.
    发明公开

    公开(公告)号:CN102375978A

    公开(公告)日:2012-03-14

    申请号:CN201010257664.8

    申请日:2010-08-17

    CPC classification number: G06K9/00449

    Abstract: 公开了一种处理图像的方法和设备。从多个图像的每个中提取格线且将所提取的格线拟合到实数二维空间中。通过将每个图像中所提取的格线与格线模板对齐来确定所拟合的格线围成的拟合单元格与格线模板的模板单元格间的对应关系。针对相对应的每对单元格,根据其间的仿射变换将模板单元格中每个像素的位置映射到实数二维空间中的实数位置。根据图像中具有与实数位置相邻的位置的多个像素的像素值生成一个像素值,以作为与实数位置对应的模板单元格中的像素的像素值。通过合并格线模板的格线和具有所生成的像素值的模板单元格中像素,生成对应于图像的合成图像。根据多个图像的相应合成图像获得表格模板。

Patent Agency Ranking