基于多文档的任务型人机对话任务的实现方法

    公开(公告)号:CN112328774A

    公开(公告)日:2021-02-05

    申请号:CN202011355592.0

    申请日:2020-11-27

    Abstract: 本申请公开了一种基于多文档的任务型人机对话任务的实现方法,包括:每轮对话结束时,利用预设人机对话任务模型对该轮对话的问答文本处理,该处理包括:基于问答文本生成问答向量;计算问答向量与各候选文档的属性相关向量的相似度;基于问答向量和相似度生成该轮对话中各候选文档的概率分布和该轮对话的属性分布;根据所述概率分布更新全局候选文档概率分布向量;根据所述属性分布更新全局属性分布向量;若满足人机对话结束条件,则基于全局候选文档概率分布向量确定任务执行结果并输出;否则,基于全局候选文档概率分布向量和全局属性分布向量,利用自然语言对话模板,确定下一提问信息。采用本发明可以提高任务执行效率和成功率,且易于实现。

    一种基于对应的深层信念网络的跨模态检索方法

    公开(公告)号:CN104462485B

    公开(公告)日:2017-12-05

    申请号:CN201410797791.5

    申请日:2014-12-18

    Abstract: 本发明提出了一种基于对应的深层信念网络的跨模态检索方法,该方法包括:利用特征提取方法分别获得检索目标与检索库中每一个检索成员的初级向量;检索目标的初级向量分别与检索库中每一个检索成员的初级向量,通过对应的深层信念网络获得检索目标的高级向量和检索库中每一个检索成员的高级向量;利用检索目标的高级向量和检索库中每一个检索成员的高级向量计算检索目标与检索库中每一个检索成员的距离;将检索库中与检索目标距离最近的至少一个检索成员确定为与检索目标匹配的对象。

    基于多文档的任务型人机对话任务的实现方法

    公开(公告)号:CN112328774B

    公开(公告)日:2022-10-25

    申请号:CN202011355592.0

    申请日:2020-11-27

    Abstract: 本申请公开了一种基于多文档的任务型人机对话任务的实现方法,包括:每轮对话结束时,利用预设人机对话任务模型对该轮对话的问答文本处理,该处理包括:基于问答文本生成问答向量;计算问答向量与各候选文档的属性相关向量的相似度;基于问答向量和相似度生成该轮对话中各候选文档的概率分布和该轮对话的属性分布;根据所述概率分布更新全局候选文档概率分布向量;根据所述属性分布更新全局属性分布向量;若满足人机对话结束条件,则基于全局候选文档概率分布向量确定任务执行结果并输出;否则,基于全局候选文档概率分布向量和全局属性分布向量,利用自然语言对话模板,确定下一提问信息。采用本发明可以提高任务执行效率和成功率,且易于实现。

    一种基于美学的图像裁剪方法及装置

    公开(公告)号:CN109146892B

    公开(公告)日:2020-06-19

    申请号:CN201810813038.9

    申请日:2018-07-23

    Abstract: 本申请实施例提供了一种基于美学的图像裁剪方法及装置,属于计算机技术领域。所述方法包括:获取待裁剪图像;根据显著性检测算法,计算所述待裁剪图像对应的显著图,其中,所述显著图包括所述待裁剪图像对应的显著度图像,所述显著度图像是灰度图像;通过显著区域提取算法,在所述显著图中确定显著边界框;在所述待裁剪图像中,确定所述显著边界框对应的显著区域,其中,所述显著区域为所述待裁剪图像中所述显著边界框包含的图像区域;根据美学区域识别算法和所述显著区域,确定包含所述显著区域的美学区域边界框;基于所述美学区域边界框,对所述待裁剪图像进行裁剪,得到目标图像。采用本发明,可以提高确定裁剪框的效率。

    一种基于自动编码器的视频分类方法及装置

    公开(公告)号:CN104866596A

    公开(公告)日:2015-08-26

    申请号:CN201510290451.8

    申请日:2015-05-29

    CPC classification number: G06F17/30781 G06K9/6267

    Abstract: 本发明实施例提供了一种基于自动编码器的视频分类方法及装置。该方法中,获得具有三种模态数据的目标视频的每一种模态数据的低级表示内容;将每一种模态数据的低级表示内容分别输入至堆叠的自动编码器组处理,获得每一种模态数据的高级表示内容;将每两种模态数据的高级表示内容的组合结果分别输入至双模态融合器处理,获得相应两种模态数据的双模态公共表示内容;将双模态公共表示内容的组合结果输入至三模态融合器处理,获得三模态公共表示内容;将三模态公共表示内容输入至有监督分类模型处理,以获得各个视频类别的类别标签,并确定目标视频所对应的视频类别。可见,通过本方案可以结合目标视频的三种模态数据对目标视频进行分类。

    一种基于深层模型的跨模态检索方法

    公开(公告)号:CN104462489A

    公开(公告)日:2015-03-25

    申请号:CN201410800393.4

    申请日:2014-12-18

    CPC classification number: G06F17/30864 G06F17/30675 G06N3/08

    Abstract: 本发明提出了一种基于深层模型的跨模态检索方法,该方法包括:利用特征提取方法分别获得目标检索模态与检索库中每一个被检索模态的低级表达向量;目标检索模态的低级表达向量分别与检索库中每一个被检索模态的低级表达向量,通过堆叠对应的受限波尔兹曼机Corr-RBMs深层模型获得目标检索模态的高级表达向量和检索库中每一个被检索模态的高级表达向量;利用目标检索模态的高级表达向量和检索库中每一个被检索模态的高级表达向量计算目标检索模态与检索库中每一个被检索模态的距离;将检索库中与目标检索模态距离最近的至少一个被检索模态确定为与目标检索模态匹配的对象。

    人机对话中智能体对话语句的生成方法和装置

    公开(公告)号:CN112860862B

    公开(公告)日:2022-11-11

    申请号:CN202110133448.0

    申请日:2021-02-01

    Abstract: 本申请公开了一种人机对话中智能体对话语句的生成方法和装置,其中方法包括:利用预先训练的自然语言理解模型,从当前人机对话的对话历史数据中,提取预设知识库中的属性值和场景类别;其中,所述知识库由知识三元组构成;基于所述属性值和所述场景类别,从所述知识库中筛选出相关的知识三元组,得到候选知识子集;基于所述对话历史数据和所述候选知识子集,利用预先训练的对话生成模型,为智能体生成当前的响应语句并输出。采用本发明,可以支持多任务场景的人机对话。

Patent Agency Ranking