基于语义预测的译文获取方法和设备

    公开(公告)号:CN101042692A

    公开(公告)日:2007-09-26

    申请号:CN200610066115.6

    申请日:2006-03-24

    Inventor: 方高林 于浩

    Abstract: 基于语义预测的译文获取方法和设备。所述方法输入一种源语言的查询项,输出该查询项在目标语言中的候选译文列表,其特征是,包括以下步骤:单元分割步骤,将输入的所述查询项尽可能地分割成有意义的候选单元集;单元译文知识库建立步骤,扩充所述候选单元在原始通用词典中的单元候选译文,并对扩充的单元候选译文进行评价形成单元译文知识库;语义预测步骤,利用基于所述单元译文知识库的语义预测的方法获得目标语言中与源语言中的所述查询项语义相关的项;有效网页获取步骤,将前述获得的语义相关项与所述查询项组合,利用组合后的项,通过搜索引擎获得有效网页;候选评价步骤,根据获取的有效网页,对候选译文进行评价得到候选译文列表。

    从文本中挖掘语义关键词的方法和设备

    公开(公告)号:CN104239300B

    公开(公告)日:2017-10-20

    申请号:CN201310223884.2

    申请日:2013-06-06

    Inventor: 缪庆亮 孟遥 于浩

    Abstract: 本发明公开了从文本中挖掘语义关键词的方法和设备。根据本发明的方法包括:在文本中搜索已知词,以得到多个候选关键词;根据所述已知词的参考概率和/或上下文,计算所述多个候选关键词的候选概率,所述参考概率表明所述已知词作为锚文本的可能性,所述候选概率表明所述候选关键词作为语义关键词的可能性;以及根据所述多个候选关键词的候选概率,确定所述多个候选关键词是否为所述文本的语义关键词。

    信息处理装置以及信息处理方法

    公开(公告)号:CN104102657B

    公开(公告)日:2017-08-25

    申请号:CN201310121409.4

    申请日:2013-04-09

    Abstract: 本公开涉及与混搭(mashup)技术相关的信息处理装置和信息处理方法。根据本公开的实施例的信息处理装置包括:记录单元,其被配置为记录对资源进行访问的请求;发现单元,其被配置为在记录单元中查找符合与资源状态变化有关的预定模式的请求组合;以及混搭单元,其被配置为在与请求组合相对应的功能组合中确定可混搭的功能组合,其中功能对应于针对相同类型的资源或者同一资源的、具有相同动作类型的请求。通过根据本公开的实施例的信息处理装置和相应的信息处理方法,实现了针对用户的使用习惯来提供混搭应用。

    用于将简体汉语句子转换为繁体汉语句子的方法和设备

    公开(公告)号:CN103853706B

    公开(公告)日:2017-04-12

    申请号:CN201210519822.1

    申请日:2012-12-06

    Inventor: 房璐 孟遥 于浩

    Abstract: 本发明公开了一种用于将简体汉语句子转换为繁体汉语句子的方法和设备。所述方法包括:由基于简体‑繁体字符一对多转换表的序列标注模型,对输入的简体汉语句子进行序列标注,以得到多组序列标注结果及其组概率;对所述简体汉语句子进行分词和词性标注;根据所述简体汉语句子中的歧义字的词性和歧义词的转换概率中的至少一个以及所述组概率,从所述多组序列标注结果中选择最佳标注结果;以及按照所述最佳标注结果,基于所述一对多转换表,将所输入的简体汉语句子中的、所述一对多转换表中出现的简体字符转换为繁体字符;其中在所述一对多转换表中,每一个简体字符对应于按顺序排列的多个候选繁体字符。

    文本挖掘方法和文本挖掘装置

    公开(公告)号:CN103678355B

    公开(公告)日:2017-03-01

    申请号:CN201210335708.3

    申请日:2012-09-11

    Abstract: 本发明涉及文本挖掘方法和文本挖掘装置。文本挖掘方法包括:提取文档中的多个关键词;计算代表每个关键词的特定属性的分值;按照多个关键词在文档中的出现顺序对计算出的分值进行排列,以得到代表文档的分值序列;以及利用分值序列进行与文本挖掘相关联的操作。

    数据处理方法和设备
    66.
    发明授权

    公开(公告)号:CN103514167B

    公开(公告)日:2017-03-01

    申请号:CN201210202800.2

    申请日:2012-06-15

    Inventor: 张波 孟遥 于浩

    Abstract: 本发明公开了一种数据处理方法和设备,该方法可以包括:活跃时间区间确定步骤,用于确定具有相似活跃习惯的微博用户群,并且基于所确定的微博用户群中的关注用户发布的微博来确定各个微博用户群的活跃时间区间;关键词提取步骤,用于从所确定的活跃时间区间内的所有微博提取关键词;以及话题确定步骤,用于基于所提取的关键词,确定所确定的活跃时间区间内的相应话题。根据本发明,可以挖掘特定微博用户群在不同的活跃时间区间内所关注的话题,从而有针对性地进行信息发布和获取,大大提高了信息处理的效率。

    生成语义网络服务文档的方法和设备

    公开(公告)号:CN103473243B

    公开(公告)日:2017-03-01

    申请号:CN201210189139.6

    申请日:2012-06-08

    Abstract: 本发明公开了一种生成语义网络服务文档的方法和设备。该方法包括获取非语义网络服务文档中感兴趣操作的第一接口结构信息;获取语义网络服务文档的第二接口结构信息;至少基于第一接口结构信息中的元素与第二接口结构信息中的元素的上下文信息和描述信息之一,匹配第一和第二接口结构信息的内容,以建立第一与第二接口结构信息中的各个元素的对应关系;根据对应关系来生成用于对第一和第二接口结构信息进行相互转换的接口转换引擎;其中,至少第二接口结构信息、接口转换引擎以及非语义网络服务文档中感兴趣操作的信息构成语义网络服务文档;其中第一接口结构信息和第二接口结构信息均为具有相互关系信息的元素的集合。

    选择参数的方法和装置
    68.
    发明授权

    公开(公告)号:CN103377298B

    公开(公告)日:2016-08-03

    申请号:CN201210122746.0

    申请日:2012-04-24

    Abstract: 本发明涉及选择参数的方法和装置。选择参数的方法包括:在已知时间序列中,提取最能指示目标时间序列的第一子已知时间序列;在已知时间序列中,提取与第一子已知时间序列最相似的多个第二子已知时间序列;针对每个第二子已知时间序列,在已知时间序列中,提取第三子已知时间序列作为测试数据,第三子已知时间序列的长度与目标时间序列的长度相同,并且第三子已知时间序列相对于第二子已知时间序列的位置关系与目标时间序列相对于第一子已知时间序列的位置关系相同;预先限定不同的多个参数集合;根据第三子已知时间序列来计算多个参数集合中的每个参数集合的预测准确度;根据预测准确度从多个参数集合中选择适当的参数集合。

    基于层次短语模型的译文词序概率确定方法及装置

    公开(公告)号:CN103116575B

    公开(公告)日:2016-06-22

    申请号:CN201110379623.0

    申请日:2011-11-16

    Inventor: 郑仲光 孟遥 于浩

    Abstract: 本发明实施例公开了一种基于层次短语模型的译文词序概率确定方法及装置。该方法包括:确定源语句的候选翻译模式;针对每一候选翻译模式提取用于表征词序概率的特征量;根据预先获得的模型训练结果确定所述特征量的词序概率;根据所述特征量的词序概率,确定所述每一候选翻译模式的词序概率;根据所述候选翻译模式中词序概率的最大值,确定所述源语句的译文词序概率。本发明实施例通过在候选翻译模式中提取表征词序概率的特征量,进而确定源语句的译文词序概率,增加对调序过程的控制,提高了翻译模式选择的正确性,减少了调序错误的出现,由此改善了将源语句转换为目标语言数据处理过程的性能。

    射频识别标签定位方法及设备以及射频识别标签读取器

    公开(公告)号:CN103150527B

    公开(公告)日:2016-03-30

    申请号:CN201110402484.9

    申请日:2011-12-06

    Inventor: 陆应亮 于浩 孟遥

    Abstract: 射频识别标签定位方法及设备以及射频识别标签读取器。该方法包括步骤:在使两个或更多个射频识别标签组成的队列相对于读取器运动的情况下由读取器以预定时间间隔发射无线信号以试图读取射频识别标签;以及根据队列中各射频识别标签被读取成功的次数随时间的分布来确定射频识别标签在队列中的位置,其中,读取器以两个或更多个输出功率交替地发射无线信号以试图读取射频识别标签,通过如下方式确定输出功率:将读取器和队列的相对位置设置为在队列相对于读取器运动的过程中射频识别标签之一与读取器最接近时的相对位置;调节读取器的输出功率,并检测读取到的射频标签数量;将输出功率设置为能够使读取器读取到不同数量个射频识别标签的输出功率。

Patent Agency Ranking