内容提取方法、内容提取装置和用于内容提取的系统

    公开(公告)号:CN105335416A

    公开(公告)日:2016-02-17

    申请号:CN201410380780.7

    申请日:2014-08-05

    Abstract: 本发明涉及内容提取方法、内容提取装置和用于内容提取的系统。内容提取方法包括:提取输入文档中的多个主题内容区域;对于至少一部分主题内容区域中的每个主题内容区域,确定该主题内容区域的结构类型,其中所述结构类型通过该主题内容区域中包含的元素确定;对于所述每个主题内容区域,根据该主题内容区域的结构类型识别该主题内容区域中的兴趣内容,其中该主题内容区域中的兴趣内容指示该主题内容区域中最可能被用户注意的至少一个元素;以及根据用户输入动作和所述每个主题内容区域中的兴趣内容,提取响应于用户输入动作的主题内容区域。通过使用主题内容区域和兴趣内容,可以在能够向用户提供有意义的内容的同时提高内容提取的准确度。

    查询意图挖掘的方法和系统

    公开(公告)号:CN103927328A

    公开(公告)日:2014-07-16

    申请号:CN201410101649.2

    申请日:2014-03-18

    CPC classification number: G06F16/9535

    Abstract: 本发明涉及一种查询意图挖掘的方法,包括如下步骤:获取搜索查询、识别搜索查询中的关键概念、识别关键概念中的数值类型、对于每一个识别得到的数值类型生成数值查询实例、从数据源中挖掘对应的候选意图、通过数值查询实例计算与其对应的候选意图的取值范围、对候选意图进行聚类、输出意图列表。本发明还公开了一种查询意图挖掘的系统,包括搜索查询获取模块、关键概念识别模块、数值类型识别模块、数值查询实例生成模块、候选意图挖掘模块、计算模块、聚类模块以及显示模块。采用本发明的技术方案根据搜索用户的查询意图对搜索结果进行有效的索引和组织等处理,有效地提高了准确率,避免了搜索用户筛选并非自己意图的搜索结果所造成的时间和精力的浪费。

    属性识别装置、方法和系统及识别对象属性的神经网络

    公开(公告)号:CN112580794A

    公开(公告)日:2021-03-30

    申请号:CN201910932514.3

    申请日:2019-09-29

    Abstract: 本发明公开了一种属性识别装置、方法和系统及识别对象属性的神经网络。所述属性识别装置利用神经网络识别对象的属性,所述神经网络包括提取子网络、确定子网络及由至少两个识别分支构成的识别子网络。所述属性识别装置包括:利用提取子网络,从输入图像中提取特征的单元,其中所提取的特征能够被所述识别子网络中的所有识别分支用于识别对象的属性;利用确定子网络,基于输入的对象类别从识别子网络中确定至少两个识别分支的单元;以及,至少利用所确定的识别分支,基于所提取的特征从输入图像中识别属于输入的对象类别的对象的属性的单元。根据本发明,大大地减小了用于识别对象的属性的神经网络的模型大小。

    对象索引方法、对象搜索方法及对象索引系统

    公开(公告)号:CN106557521B

    公开(公告)日:2020-07-14

    申请号:CN201510639082.9

    申请日:2015-09-29

    Abstract: 一种对象索引方法、对象搜索方法及对象索引系统,该对象索引方法包括:初始化步骤,划分至少一个第一数据容器和第二数据容器,及使用第一和第二索引器来分别初始化第一和第二数据容器;第一索引步骤,使用第一索引器把特定对象的输入的特征向量加入当前被填充的第一容器中;第二索引步骤,在当前被填充的第一容器中的数据尺寸已达阈值时,选择另一第一容器作为当前被填充的第一容器,并在执行第一索引步骤的情况下,用第二索引器把前一个填充的第一容器中的批量数据转换到能够使用的一个第二数据容器中;该第一和第二容器的尺寸被设置为使得第二索引器把批量数据转换到第二容器中的时段不大于第一索引器填充第一数据容器达到阈值的时段。

    内容提取方法、内容提取装置和用于内容提取的系统

    公开(公告)号:CN105335416B

    公开(公告)日:2018-11-02

    申请号:CN201410380780.7

    申请日:2014-08-05

    Abstract: 本公开涉及内容提取方法、内容提取装置和用于内容提取的系统。内容提取方法包括:提取输入文档中的多个主题内容区域;对于至少一部分主题内容区域中的每个主题内容区域,确定该主题内容区域的结构类型,其中所述结构类型通过该主题内容区域中包含的元素确定;对于所述每个主题内容区域,根据该主题内容区域的结构类型识别该主题内容区域中的兴趣内容,其中该主题内容区域中的兴趣内容指示该主题内容区域中最可能被用户注意的至少一个元素;以及根据用户输入动作和所述每个主题内容区域中的兴趣内容,提取响应于用户输入动作的主题内容区域。通过使用主题内容区域和兴趣内容,可以在能够向用户提供有意义的内容的同时提高内容提取的准确度。

    查询意图挖掘的方法和系统

    公开(公告)号:CN103927328B

    公开(公告)日:2017-04-19

    申请号:CN201410101649.2

    申请日:2014-03-18

    Abstract: 本发明涉及一种查询意图挖掘的方法,包括如下步骤:获取搜索查询、识别搜索查询中的关键概念、识别关键概念中的数值类型、对于每一个识别得到的数值类型生成数值查询实例、从数据源中挖掘对应的候选意图、通过数值查询实例计算与其对应的候选意图的取值范围、对候选意图进行聚类、输出意图列表。本发明还公开了一种查询意图挖掘的系统,包括搜索查询获取模块、关键概念识别模块、数值类型识别模块、数值查询实例生成模块、候选意图挖掘模块、计算模块、聚类模块以及显示模块。采用本发明的技术方案根据搜索用户的查询意图对搜索结果进行有效的索引和组织等处理,有效地提高了准确率,避免了搜索用户筛选并非自己意图的搜索结果所造成的时间和精力的浪费。

    用于挖掘意图的方法和设备

    公开(公告)号:CN103942204A

    公开(公告)日:2014-07-23

    申请号:CN201310019620.5

    申请日:2013-01-18

    CPC classification number: G06F17/30867

    Abstract: 本发明公开了用于挖掘意图的方法和设备。该用于挖掘意图的方法包括:接收步骤,接收输入的查询;预获取步骤,基于所接收到的查询来获取第一组候选意图;构建步骤,为所述查询构建至少一个临时意图模式;获取步骤,基于所述至少一个临时意图模式来获取第二组候选意图;以及组合步骤,将所述第一组候选意图和第二组候选意图进行组合以获得所述查询的候选意图;其中,所述临时意图模式包括所述查询和上下文字符。

    机器翻译系统、机器翻译方法和与其一起使用的解码器

    公开(公告)号:CN103823795A

    公开(公告)日:2014-05-28

    申请号:CN201210464448.X

    申请日:2012-11-16

    Inventor: 那森 杨振东

    Abstract: 本公开内容提供了机器翻译系统、机器翻译方法和与其一起使用的解码器。该机器翻译方法包括以下步骤:接收第一语言的文本;创建反映所述第一语言的文本中的每个短语组合的短语组合概率的短语组合模型;通过使用所述短语组合模型、翻译模型和语言模型将所述第一语言的文本翻译为第二语言的文本;将所述第二语言的文本作为翻译结果输出,其中,所述翻译结果包含被翻译短语。

Patent Agency Ranking