多媒体对象检索设备和方法

    公开(公告)号:CN1581172A

    公开(公告)日:2005-02-16

    申请号:CN200410070553.0

    申请日:2004-08-06

    Abstract: 本发明提供了一种多媒体对象检索设备和方法,用于在同时包含多媒体对象和相关注释文本的结构化文档中检索多媒体对象。本发明的设备和方法对输入的结构化文档进行分析,并将其表示为诸如DOM树那样的某种分析结果;识别所输入的分析结果中的主块,并输出主块标示结构化文档模型;提取多媒体对象和所述注释的配对,并输出诸如XML格式对象索引那样的结构化对象索引;以及在结构化对象索引中进行搜索,并获得目标对象列表。本发明的设备和方法可适用于各种结构化文档,可以更高精度地提取对象注释,可提取内容对象的公共注释,并可标识对象与文档标题间的关系。

    网络服务构建方法和设备以及网页数据抽取方法和设备

    公开(公告)号:CN103838747B

    公开(公告)日:2017-07-07

    申请号:CN201210479166.7

    申请日:2012-11-22

    Abstract: 本发明公开了一种网络服务构建方法和设备以及网页数据抽取方法和设备。所述网络服务构建方法包括:收集与深层网页的访问有关的数据,所述数据包括HTTP消息、JS事件、堆栈快照;在所收集的HTTP消息中,搜索服务相关参数,并将搜索到的参数分为用户输入参数、显式参数、隐式参数;构建能够生成显式参数的第一XPath;构建能够生成隐式参数的JS代码;构建能够生成最终的深层网页返回结果的第二XPath;以及根据JS事件、堆栈快照和所观察的HTTP消息的顺序,构建表示服务内部流程的结构;其中所述用户输入参数、JS代码、第一和第二XPath、表示服务内部流程的结构构成所述网络服务。

    信息处理设备和信息处理方法

    公开(公告)号:CN103914447B

    公开(公告)日:2017-04-19

    申请号:CN201310008659.7

    申请日:2013-01-09

    Inventor: 郑仲光 孟遥 于浩

    Abstract: 本公开涉及信息处理设备和信息处理方法。信息处理设备包括:互译关系获取单元,其获取双语平行语料中语料在两种语言之间的互译关系;名词性成分确定单元,其对语料在第二语言中进行词性标注,并确定语料在两种语言中的名词性成分和非名词性成分;归一化单元,其将语料在两种语言中的名词性成分替换为指代符号,从而形成在两种语言中的结构化语料;结构化模式生成单元,其生成两种语言之间的结构化模式;和短语化模式生成单元,其生成两种语言之间的短语化模式。通过根据公开的信息处理设备和信息处理方法,可以提供两种语言之间的结构化模式和短语化模式,从而有可能更好地在两种语言之间转换语料。

    数据处理装置、数据处理方法以及电子设备

    公开(公告)号:CN104111917B

    公开(公告)日:2017-04-12

    申请号:CN201310138955.9

    申请日:2013-04-19

    Inventor: 张姝 孟遥 于浩

    CPC classification number: G06F17/28

    Abstract: 本发明提供了数据处理装置、数据处理方法以及电子设备,以克服现有的语言数据处理技术所存在的处理精度不高的问题。上述数据处理装置包括:语义角色标注单元,用于对源语言语句以及作为其译文的候选调序结果的多个目标语言语句分别进行语义角色标注,以获得源语言语义角色序列以及多个目标语言语义角色序列;匹配单元,用于基于预定双语语料库获得上述源语言语义角色序列分别与每个上述目标语言语义角色序列之间的匹配分数;以及调序结果确定单元,用于将匹配分数最高的目标语言语义角色序列对应的候选调序结果确定为最终调序结果。本发明的上述技术能够应用于数据处理领域。

    整合单元执行装置、生成装置和相应方法及相应移动终端

    公开(公告)号:CN103856447B

    公开(公告)日:2017-04-05

    申请号:CN201210505480.8

    申请日:2012-11-30

    Abstract: 本公开涉及作为应用整合结果的整合单元的执行装置、生成装置和相应方法及包括其的移动终端。通过整合包括至少一个内部单元的可用单元生成整合单元。执行装置包括:身份控制模块,在整合单元所整合的内部单元要访问要求进行身份认证的对象时在对象处进行身份认证并从对象接收认证通过后的许可信息;代理模块,接收用户的输入并以预定方式调用整合单元所整合的可用单元,若所调用的可用单元是要访问对象的内部单元,则将由身份控制模块所提供的许可信息以加密方式附在由代理模块发布的用于调用该内部单元的广播信息中,使移动终端中没有访问该对象权限的内部单元无法得到许可信息。通过根据本公开的实施例,可以实现更好的安全性且不改变网络配置。

    用于评价文本的情感度及用于评价实体的方法和设备

    公开(公告)号:CN103885933B

    公开(公告)日:2017-03-01

    申请号:CN201210564243.9

    申请日:2012-12-21

    Inventor: 缪庆亮 孟遥 于浩

    Abstract: 本发明公开了一种用于评价文本的情感度的方法和设备。所述用于评价文本的情感度的方法包括:从待评价的文本中抽取目标词和观点词;在包括有目标词簇与观点词之间的情感关系的情感语义图中,搜索与所抽取的目标词对应的或者在语义上最相近的目标词簇,搜索与所述目标词簇相关联的所述观点词;根据所述情感语义图中的所述目标词簇与所述观点词之间的情感强度和情感极性,计算所述待评价的文本的情感度。

    提取相似子时间序列的方法和装置

    公开(公告)号:CN102880621B

    公开(公告)日:2017-03-01

    申请号:CN201110203979.9

    申请日:2011-07-14

    Abstract: 本发明涉及用于从时间序列提取与基准序列相似的子时间序列的方法和装置。其中,用于从时间序列提取与基准序列相似的子时间序列的方法包括:分别根据时间序列和基准序列的变化趋势对时间序列和基准序列进行变换;将变换后的时间序列分割成多个子时间序列;针对多个子时间序列中的每个子时间序列,计算每个子时间序列与变换后的基准序列之间的编辑距离;以及根据计算出的编辑距离从多个子时间序列中提取与基准序列相似的子时间序列。

    对实体关系模式进行聚类、提取的方法和设备

    公开(公告)号:CN103365912B

    公开(公告)日:2016-12-14

    申请号:CN201210100155.3

    申请日:2012-04-06

    Abstract: 提供了一种对实体关系模式进行聚类、提取的方法和设备。对实体关系模式进行聚类的方法包括:对原始句子进行预处理,以识别原始句子中表示实体的实体词;根据实体词和关系词本体中的关系词以及实体词和关系词在预处理后的句子中的特定出现序列确定预处理后的句子中的实体词之间的实体关系,并且根据所确定的实体关系将预处理后的句子拆分成子句;提取拆分后的子句的实体关系模式,其中,子句的实体关系模式用实体词及实体词之间的中语境组成的关系元组来表示;计算所提取的子句的实体关系模式之间的第一相似度;以及根据所计算的子句的实体关系模式之间的第一相似度,将子句的实体关系模式聚类成实体关系模式类。

    生成用于基于统计的机器翻译的规则的方法和设备

    公开(公告)号:CN101989287B

    公开(公告)日:2016-12-14

    申请号:CN200910160943.X

    申请日:2009-07-31

    Inventor: 何中军 孟遥 于浩

    Abstract: 生成用于基于统计的机器翻译的规则的方法和设备。该设备包括:规则提取装置,其从平行语料库中提取规则;规则过滤装置,其从所提取的规则中过滤源语言短语或目标语言短语不是预定短语的任何一个的规则;规则识别装置,其从所提取的规则中识别由最小规则单调地构成的单调组合规则,其中源语言短语的顺序与源语言短语的对应目标语言短语的顺序相同,最小规则是不能进一步拆分出更小完整规则的规则,完整规则是对应关系不涉及该规则之外的短语的规则;以及短语提取装置,其从源语言或目标语言的单语语料库中提取统计特征满足预定要求的短语作为预定短语。规则过滤装置还从所提取的规则中过滤所识别的单调组合规则,统计特征包括所提取的短语的C-value值。

Patent Agency Ranking