校正语料中的成语错误的装置和方法

    公开(公告)号:CN103853702B

    公开(公告)日:2016-08-17

    申请号:CN201210520870.2

    申请日:2012-12-06

    Abstract: 本申请公开了一种校正语料中的成语错误的装置和方法,该装置包括:变形成语检测单元,检测语料中成语的变形;第一判断单元,判断成语的变形是否存在于近义词词典或易混淆词词典中;语义相似确定单元,在确定成语的变形不在近义词词典和易混淆词词典中时,确定其与原成语之间的语义是否相似;第二判断单元,在确定成语的变形与原成语之间的语义不相似时,确定其不正确,否则确定其正确;语音相似度计算单元,在确定成语的变形不正确的情况下,计算成语的变形与原成语之间的语音相似度;字形相似度计算单元,在确定成语的变形不正确的情况下,计算其与原成语之间的字形相似度;以及校正单元,在确定成语的变形不正确的情况下,校正成语的变形。

    确定语料与实体的相关性的方法和装置及分类器训练方法

    公开(公告)号:CN103514194B

    公开(公告)日:2016-08-17

    申请号:CN201210212662.6

    申请日:2012-06-21

    Inventor: 张姝 孟遥 于浩

    Abstract: 本发明公开了一种确定语料与实体的相关性的方法和装置及分类器训练方法。所述确定相关性的方法包括:利用通用分类器基于从作为未标注语料的第二组语料提取的通用特征对第二组语料进行分类,以确定第二组语料中的每个语料与第一给定实体的相关性,从而得到作为对第二组语料的标注结果的机器标注语料;基于所述通用特征和从机器标注语料中选取的与第一给定实体相关的补充特征,结合实体名称相关的启发式规则,利用机器标注语料,训练针对第一给定实体的自适应分类器;以及基于从第一组语料提取的通用特征和所述补充特征,结合实体名称相关的启发式规则,利用训练好的自适应分类器,确定第一组语料中的每个语料与第一给定实体的相关性。

    一种分批聚类方法和系统
    63.
    发明授权

    公开(公告)号:CN102867006B

    公开(公告)日:2016-04-13

    申请号:CN201110189562.1

    申请日:2011-07-07

    Abstract: 本发明实施例提供一种分批聚类方法和系统,所述方法包括:按照预定策略对要聚类的文档进行分批;对分批后的每一批文档进行聚类,得到每一批文档的聚类结果;对每一批文档的聚类结果进行凝聚性处理,得到每一批文档的凝聚性处理结果;将除第一批文档以外的每一批文档的凝聚性处理结果中的每一类与上一批文档的凝聚性处理结果中的类合并,得到所述要聚类的文档的分批聚类结果。本实施例的分批聚类方法,通过对要聚类的文档进行分批聚类、批聚类结果的凝聚性处理以及批凝聚性处理结果的合并,提高了聚类性能,实现了增量式的聚类。

    处理语言数据的装置、方法以及设备

    公开(公告)号:CN103377184B

    公开(公告)日:2016-03-30

    申请号:CN201210110614.6

    申请日:2012-04-16

    Inventor: 葛乃晟 孟遥 于浩

    Abstract: 本发明的实施例涉及处理语言数据的装置、方法以及设备,以至少克服现有的语言处理技术所存在的不能消除语句结构歧义的问题。上述处理语言数据的装置包括:用于识别能够符合至少两种句法关系的至少两个词法单元的识别模块;用于分别针对每种句法关系得到候选语句的转换模块;用于对各个候选语句进行评分的评分模块;以及用于将上述识别的词法单元确定为具有与得分最高的候选语句相对应的句法关系的确定模块。上述处理语言数据的方法用于执行能够实现上述处理语言数据的装置的功能的处理。上述设备包括上述处理语言数据的装置。应用本发明的上述技术,能够消除语言数据中的具有句法歧义的结构的歧义,可以应用于自然语言处理领域。

    短期电力负荷预测的方法及装置

    公开(公告)号:CN102779223B

    公开(公告)日:2016-03-30

    申请号:CN201110128152.6

    申请日:2011-05-13

    Abstract: 本发明实施例公开了短期电力负荷预测的方法及装置,所述方法包括:获取用于学习的历史电力负荷数据;对所述历史电力负荷数据进行压缩;对压缩后的历史电力负荷数据进行过滤,并采用过滤后的历史电力负荷数据训练预测模型;根据所述预测模型预测目标电力负荷。本发明实施例公开的方法或装置,能够降低短期电力负荷预测的复杂化程度,进一步的,还能保证预测结果的准确性和精确性。

    多数据源的信息处理装置、服务器及方法

    公开(公告)号:CN105335378A

    公开(公告)日:2016-02-17

    申请号:CN201410291263.2

    申请日:2014-06-25

    Abstract: 本发明实施例提供一种多数据源的信息处理装置、服务器及方法,该装置包括:第一判定单元,用于对至少两个数据源中的信息进行同一实体的判定;链接单元,用于将至少两个数据源中的实体链接到预先设定的外部资源中;第一扩展单元,用于根据外部资源中的信息对实体的属性进行扩展;第二判定单元,用于判断属性扩展后的信息是否满足预先设定的条件,当不满足预先设定的条件时,将属性扩展后的信息用于进行所述同一实体的判定,当满足预先设定的条件时,将属性扩展后的信息输出。通过对同一实体进行判定以及链接外部资源进行扩展属性,并且以迭代的方式进行上述判定和链接,能够有效的进行多数据源的信息整合,提高信息的准确性和全面性。

    人名单元词典扩充方法、人名语言识别方法和装置

    公开(公告)号:CN105095322A

    公开(公告)日:2015-11-25

    申请号:CN201410221701.8

    申请日:2014-05-23

    Abstract: 公开了人名单元词典扩充方法、人名语言识别方法和装置,该人名单元词典扩充方法包括:计算各个词项在预定多个语言的人名单元词典中的初始权重;将人名划分为人名单元,将划分的人名单元与各个词典中的词项进行匹配以确定匹配人名单元和未匹配人名单元;根据匹配人名单元在各个词典中的权重来确定包含匹配人名单元的人名在各个词典中的权重;根据包含未匹配人名单元的所有人名在各个词典中的权重计算未匹配人名单元在各个词典中的权重,并将未匹配人名单元添加到词典中;根据包含匹配人名单元的所有人名在各个词典中的权重更新匹配人名单元在各个词典中的权重;重复上述处理直至满足预定条件,从而得到带权重标注的人名单元词典。

    信息处理装置和通过外码输入目标语言文字的方法

    公开(公告)号:CN105094358A

    公开(公告)日:2015-11-25

    申请号:CN201410213325.8

    申请日:2014-05-20

    Abstract: 公开了一种信息处理装置和通过外码输入目标语言文字的方法。从最近输入的目标语言文字中获得目标语句序列,针对目标语句序列中的每个目标语句,在源语言的源语句序列中识别一个对应源语句子序列。每个所述目标语句是相应源语句子序列的每个源语句的译文的可能性较大,且目标语句序列中相邻目标语句的对应源语句子序列在源语句序列中的相互距离较小。每个源语句子序列包含尽可能多的可能性较大的连续源语句。估计源语句序列中的可能当前源语句,其包括在覆盖所有源语句子序列的最小区间之外但与区间接近的至少一个语句。在假设当前正在输入或将要输入可能当前语句的目标语言的译文的情况下,减少输入的外码的歧义。

    射频识别标签定位方法和装置

    公开(公告)号:CN102890765B

    公开(公告)日:2015-10-14

    申请号:CN201110209834.X

    申请日:2011-07-20

    Abstract: 本发明涉及射频识别标签定位方法和装置,其中该射频识别标签定位方法包括:使用RFID阅读器的天线在当前发射功率下读取多个标签第一预定次数;记录每个标签在天线的当前发射功率下被成功读取的次数;根据天线的当前发射功率、标签的最低反应功率以及标签之间距离的最小分辨率确定天线的下一发射功率;将确定的天线的下一发射功率作为天线的当前发射功率,重复执行以上步骤第二预定次数;计算每个标签被成功读取的次数的总和;以及根据每个标签被成功读取的次数的总和对多个标签进行排序,来确定各个标签相对于天线的排列顺序。

    地名搜索装置和系统

    公开(公告)号:CN101840406B

    公开(公告)日:2015-10-14

    申请号:CN200910129465.6

    申请日:2009-03-20

    Abstract: 提供一种地名搜索装置包括:地名关系信息库生成单元,用于生成作为搜索目的地的地名的地名关系信息库,所述地名关系信息库包括地名、与所述地名相关联的信息项、以及与所述地名相关联的目标项;预处理单元,用于对输入的待搜索关键字进行预处理,以使得所述待搜索关键字的属性与所述信息项中至少一部分信息项的属性相同;和搜索单元,用于利用经所述预处理单元预处理后的待搜索关键字在所述地名关系信息库中进行搜索,以便通过所述预处理后的待搜索关键字的属性与所述至少一部分信息项的属性之间的匹配,获得与所述输入的待搜索关键字相对应的地名及其目标项。这种地名搜索装置可提高地名搜索处理的效率和准确性。还提供一种地名搜索方法。

Patent Agency Ranking