一种基于采样频率优化的主动学习短文本分类方法和系统

    公开(公告)号:CN111897912A

    公开(公告)日:2020-11-06

    申请号:CN202010669590.2

    申请日:2020-07-13

    Abstract: 本发明公开了基于采样频率优化的主动学习短文本分类方法和系统,拓宽主动学习优化方向,提供业界广泛使用的简单有效的优化框架。其技术方案为:文本分类器学习已标注数据;基于文本分类器的学习结果对未标注数据进行采样评估并选出最有价值数据;对选出数据进行手动标注并加入到已标注数据中,重复上述步骤直到迭代次数达到上限或准确度达标。在采样评估过程中,对已标注数据,根据其所属类别进行分类,统计每种类别已标注的数据量,得到各自的采样频率数据;对未标注数据,对未标注数据先进行评估得到初始评估分值及其预测结果类别,然后根据预测结果类别获取对应的采样频率数据,基于初始评估分值和对应类别的采样频率数据得到最终评估分值。

    任务型对话系统的对话状态跟踪、训练方法及系统

    公开(公告)号:CN111611347A

    公开(公告)日:2020-09-01

    申请号:CN202010443243.8

    申请日:2020-05-22

    Abstract: 本发明公开了一种任务型对话系统的对话状态跟踪、训练方法及系统,提高了多领域复杂场景中的对话状态跟踪准确率。其技术方案为:对话历史进行预处理,获得以词为单位的对话历史文本的向量化表示;对向量化的对话历史文本,使用双向长短期记忆网络作为编码器进行编码;初始化解码器,解码出目标槽位信息;关注对话历史中的目标槽位信息,通过注意力机制计算对话历史中每个词对于目标槽位的重要程度;判断输入的对话历史中是否提及目标槽位,若提及目标槽位则进行下一步的处理,否则方法结束;从对话历史的向量化表示、对话历史的原始输入以及历史对话状态中分别寻找目标槽位取值,最后据此得到目标槽位的最终取值。

    用于对话系统情景匹配的多模态融合学习分析方法和系统

    公开(公告)号:CN111581470A

    公开(公告)日:2020-08-25

    申请号:CN202010415082.1

    申请日:2020-05-15

    Abstract: 本发明公开了一种用于对话系统情景匹配的多模态融合学习分析方法和系统,能够提高场景匹配率,提升用户体验,更加智能理解用户需求。其技术方案为:本发明处理和理解多源模态信息,分别对图像信息、音频信息和文本信息进行特征抽取得到各自特征的向量化表达,再将这些向量化表达通过注意力机制对不同模态的动态权重进行学习调整,同时对场景定义也进行特征抽取以得到其向量化表达,再将注意力机制加权后的输出向量和场景定义特征抽取后的输出向量,通过全连接层将这两个向量进行进一步的映射以进行转换,实现最终的分类决策动作。

    一种面向聊天机器人的混合策略式情感安抚系统

    公开(公告)号:CN108960402A

    公开(公告)日:2018-12-07

    申请号:CN201810596514.6

    申请日:2018-06-11

    Inventor: 王昊奋 赵迎功

    CPC classification number: G06N3/008 G06K9/6267 G06N3/02

    Abstract: 本发明公开了一种面向聊天机器人的混合策略式情感安抚系统和方法,以情感计算为核心并以此为基础具备任务完成、自动问答等一系列能力,有效填补了目前市场上已有的聊天机器人的各种不足。其技术方案为:系统包括:面向情感计算的语言理解模块,从用户查询中识别出当前用户查询的意图标签、关键词槽和可能蕴含的情感类别;面向情感计算的对话管理模块,为用户查询生成候选用户响应,根据通过多轮对话确定的对话状态对生成的候选情感响应进行重排序,并生成重排序的用户响应;面向情感计算的语言生成模块,对面向情感计算的对话管理模块输出的重排序的用户响应,根据用户设定的机器人画像生成最终的用户响应。

Patent Agency Ranking