选择参数的方法和装置
    121.
    发明公开

    公开(公告)号:CN103377298A

    公开(公告)日:2013-10-30

    申请号:CN201210122746.0

    申请日:2012-04-24

    Abstract: 本发明涉及选择参数的方法和装置。选择参数的方法包括:在已知时间序列中,提取最能指示目标时间序列的第一子已知时间序列;在已知时间序列中,提取与第一子已知时间序列最相似的多个第二子已知时间序列;针对每个第二子已知时间序列,在已知时间序列中,提取第三子已知时间序列作为测试数据,第三子已知时间序列的长度与目标时间序列的长度相同,并且第三子已知时间序列相对于第二子已知时间序列的位置关系与目标时间序列相对于第一子已知时间序列的位置关系相同;预先限定不同的多个参数集合;根据第三子已知时间序列来计算多个参数集合中的每个参数集合的预测准确度;根据预测准确度从多个参数集合中选择适当的参数集合。

    处理、预测包含样本点的时间序列的方法和设备

    公开(公告)号:CN103294729A

    公开(公告)日:2013-09-11

    申请号:CN201210055852.1

    申请日:2012-03-05

    Abstract: 提供一种处理、预测包含样本点的时间序列的方法和设备。该处理包含样本点的时间序列的方法包括:确定每个历史时间序列/当前时间序列中的每个样本点在每个历史时间序列/当前时间序列中的相对位置;将每个历史时间序列/当前时间序列中的每个样本点编码为能够反映其在每个历史时间序列/当前时间序列中的相对位置的编码;根据编码后的历史时间序列与编码后的当前时间序列之间的相似度,从编码后的历史时间序列中选择参考时间序列;以及通过统计参考时间序列中的编码的平均值和标准差,来确定参考时间序列中的编码在参考时间序列中的分布函数,其中,参考时间序列和分布函数用于预测当前时间序列中的下一样本点。

    确定微博与给定实体的相关性的方法和装置

    公开(公告)号:CN103164428A

    公开(公告)日:2013-06-19

    申请号:CN201110414476.6

    申请日:2011-12-13

    Abstract: 本发明涉及确定微博与给定实体的相关性的方法和装置。确定多个微博中的每个微博与给定实体的相关性的方法包括:提取多个微博中的每个微博的特征;根据所提取的特征确定微博之间的相似度;以及利用所确定的微博之间的相似度,基于半监督分类器来确定多个微博中的每个微博与给定实体的相关性。

    对负荷进行预测的方法和装置

    公开(公告)号:CN102968669A

    公开(公告)日:2013-03-13

    申请号:CN201110270387.9

    申请日:2011-08-31

    Abstract: 本发明提出一种对负荷进行预测的方法和装置。对负荷进行预测的方法包括:基于与负荷相关联的历史数据来预测粗略表示负荷的未来发展趋势的初步预测曲线;基于与负荷相关联的历史数据来确定负荷发生过异常的异常节点;从搜集的过去的网络信息中提取与异常节点相关联并影响负荷的一个或多个关键词;在搜集的当前的网络信息中查找一个或多个关键词;以及基于一个或多个关键词中的每个关键词对负荷造成的影响来修正初步预测曲线,以得到精确表示负荷的未来发展趋势的最终预测曲线。

    同名人物搜索方法及系统
    125.
    发明公开

    公开(公告)号:CN102880623A

    公开(公告)日:2013-01-16

    申请号:CN201110209561.9

    申请日:2011-07-13

    Abstract: 本发明实施例公开了一种同名人物搜索方法及装置,其中,所述方法包括:针对输入的目标人物名称,检索得到包含所述目标人物名称的相关文档;分别提取各个相关文档中的人物关系特征信息,统计各个相关文档中的所述人物关系特征信息,建立人物关系图,并计算所述目标人物名称与所述人物关系图中其他人物名称之间的关系强度;根据各个相关文档各自包含的人物名称,以及所述关系强度,为各个相关文档建立人物关系特征向量;根据所述人物关系特征向量,对各个相关文档进行聚类,得到人物关系聚类结果,以便至少根据所述人物关系聚类结果给出搜索结果。通过本发明,能够提高同名人物聚类的准确度,进而提高搜索结果的质量,提升搜索引擎的性能。

    构建标注网页语料库的方法及装置

    公开(公告)号:CN102831131A

    公开(公告)日:2012-12-19

    申请号:CN201110172092.8

    申请日:2011-06-16

    Abstract: 本发明实施例公开了一种构建标注网页语料库的方法及装置,所述方法包括:针对预先选取的初始种子网页生成初始种子标注网页语料;按照初始种子标注网页语料的关键词从搜索引擎中获取预设个数的相关种子网页;按照初始种子网页标注语料对相关种子网页进行标注,得到相关种子标注网页语料;判断相关种子标注网页语料和初始种子标注网页语料是否满足预设条件,如果是,则将相关种子标注网页语料和初始种子标注网页语料组合为标注网页语料库;如果否,则将相关种子标注网页语料作为初始种子标注网页语料,并执行从搜索引擎中获取预设个数的相关种子网页的步骤。通过本发明实施例,能够在给定的少量种子标注语料的情况下,形成大规模的标准标注语料。

    生成与维护网页内容抽取模板的方法和设备

    公开(公告)号:CN102073654B

    公开(公告)日:2012-12-19

    申请号:CN200910226108.1

    申请日:2009-11-20

    Abstract: 本发明提供了生成与维护网页内容抽取模板的方法和设备。所述生成网页内容抽取模板的装置包括:输入单元;权重计算单元,被配置成计算各个输入树中的每种类型的节点的权重;最大对齐关系计算单元;合并单元;确定单元;和选择单元。所述维护网页内容抽取模板的装置包括:相似度计算单元,计算出相似度序列;统计量计算单元,利用预定大小的窗口遍历所述相似度序列并计算窗口中的统计量;统计量判断单元,根据计算的统计量来判断网页内容抽取模板是否已不适应输入网页;和重新计算单元。本发明可以高效地自动生成网页内容抽取模板,并在由于网页发生变化而导致抽取模板失效或者准确度下降时,可以快速地自动重新生成网页内容抽取模板。

    短期电力负荷预测的方法及装置

    公开(公告)号:CN102779223A

    公开(公告)日:2012-11-14

    申请号:CN201110128152.6

    申请日:2011-05-13

    Abstract: 本发明实施例公开了短期电力负荷预测的方法及装置,所述方法包括:获取用于学习的历史电力负荷数据;对所述历史电力负荷数据进行压缩;对压缩后的历史电力负荷数据进行过滤,并采用过滤后的历史电力负荷数据训练预测模型;根据所述预测模型预测目标电力负荷。本发明实施例公开的方法或装置,能够降低短期电力负荷预测的复杂化程度,进一步的,还能保证预测结果的准确性和精确性。

    用于统计目标观众的收视率的方法和装置

    公开(公告)号:CN102655607A

    公开(公告)日:2012-09-05

    申请号:CN201110062124.9

    申请日:2011-03-04

    Abstract: 本发明涉及用于统计目标观众的收视率的方法和装置。用于统计目标观众的收视率的方法包括:分类体系构建步骤,构建分类体系;知识库构建步骤,对分类体系进行组织以构建知识库;收视数据获取步骤,获取收视数据;收视数据表示步骤,按照所述分类体系中所包括的与目标观众相关联的分类体系,基于知识库将收视数据表示成相应特征空间中的点;分类器构造步骤,按照与目标观众相关联的分类体系,在特征空间中通过小样本学习来构造分类器;以及收视率统计步骤,利用所构造的分类器统计目标观众的收视率。通过本发明,可以提高收视率的准确性并可以统计针对目标观众的收视率。

    机器学习方法和装置

    公开(公告)号:CN102402713A

    公开(公告)日:2012-04-04

    申请号:CN201010280239.0

    申请日:2010-09-09

    Abstract: 本发明公开了一种机器学习方法和装置。所述机器学习方法包括:利用不同的方法从未标注的数据集中自动标注和获取n个不同的种子集合S1,S2,...,Sn,n是自然数且n≥2;利用所述n个已自动标注的种子集合S1,S2,...,Sn分别训练相应的n个分类器C1,C2,...,Cn;对于所述n个已自动标注的种子集合中的每个种子集合Si,i=1,2,...,n,利用所述n个分类器中的除由该种子集合Si训练的分类器Ci之外的部分或全部分类器对该种子集合Si进行验证;以及利用经验证的所述n个种子集合S1,S2,...,Sn分别再次训练所述相应的n个分类器C1,C2,...,Cn。

Patent Agency Ranking