一种基于强化学习的多轮对话答复选择模型及其方法

    公开(公告)号:CN109597876B

    公开(公告)日:2023-04-11

    申请号:CN201811319709.2

    申请日:2018-11-07

    Applicant: 中山大学

    Inventor: 林键 卓汉逵

    Abstract: 本发明公开了一种基于强化学习的多轮对话答复选择模型及其方法,该模型包括:策略网络模块,采用随机策略,在各个状态空间下对上下文文本的各句子中的各个单词采样一个动作,从而对整个上下文文本得到一个动作序列,并根据分类网络的分类结果获得延时奖励;上下文文本重构网络,根据所述策略网络模块输出的动作序列,重构出一个新的上下文文本;分类网络模块,将上下文文本重构网络重构后的上下文文本与候选回答句子进行匹配,最后得到分类结果,并根据分类结果计算得到一个损失值,将该损失值作为延迟奖励更新所述策略网络模块,本发明不仅能够自动地过滤掉与任务无关的词语,同时在句子匹配的过程中充分考虑了不同句子与回答之间的语义相关性。

    一种基于强化学习的多轮对话答复选择模型及其方法

    公开(公告)号:CN109597876A

    公开(公告)日:2019-04-09

    申请号:CN201811319709.2

    申请日:2018-11-07

    Applicant: 中山大学

    Inventor: 林键 卓汉逵

    Abstract: 本发明公开了一种基于强化学习的多轮对话答复选择模型及其方法,该模型包括:策略网络模块,采用随机策略,在各个状态空间下对上下文文本的各句子中的各个单词采样一个动作,从而对整个上下文文本得到一个动作序列,并根据分类网络的分类结果获得延时奖励;上下文文本重构网络,根据所述策略网络模块输出的动作序列,重构出一个新的上下文文本;分类网络模块,将上下文文本重构网络重构后的上下文文本与候选回答句子进行匹配,最后得到分类结果,并根据分类结果计算得到一个损失值,将该损失值作为延迟奖励更新所述策略网络模块,本发明不仅能够自动地过滤掉与任务无关的词语,同时在句子匹配的过程中充分考虑了不同句子与回答之间的语义相关性。

    一种基于情景感知的智能电视节目推荐系统

    公开(公告)号:CN105721936B

    公开(公告)日:2018-01-16

    申请号:CN201610038269.8

    申请日:2016-01-20

    Applicant: 中山大学

    Abstract: 本发明实施例公开了一种基于情景感知的智能电视节目推荐系统,其中,该系统包括:电视前端子系统,用于从云端获取相关任务的推荐节目名单;用户识别系统,用于对视频流以及图片中的运动信息进行人脸识别和情绪识别,获取用户的特征参数及识别结果,根据用户的特征参数和识别结果将节目进行排序,将排序靠前的节目推荐给用户,将用户数据上传到云端进行识别,同时从云端获取相关任务的推荐节目名单提供给电视前端子系统使用;并显示识别结果及推荐节目名单。在本发明实施例中,全方面收集用户观看电视时的情绪信息和对电视节目的反馈信息,并根据这些信息针对用户群构建适合用户观看的最佳节目列表,可以提高用户体验,使用户更愉悦地观赏电视节目。

    一种基于情景感知的智能电视节目推荐系统

    公开(公告)号:CN105721936A

    公开(公告)日:2016-06-29

    申请号:CN201610038269.8

    申请日:2016-01-20

    Applicant: 中山大学

    CPC classification number: H04N21/44218 H04N21/26258 H04N21/4667 H04N21/4668

    Abstract: 本发明实施例公开了一种基于情景感知的智能电视节目推荐系统,其中,该系统包括:电视前端子系统,用于从云端获取相关任务的推荐节目名单;用户识别系统,用于对视频流以及图片中的运动信息进行人脸识别和情绪识别,获取用户的特征参数及识别结果,根据用户的特征参数和识别结果将节目进行排序,将排序靠前的节目推荐给用户,将用户数据上传到云端进行识别,同时从云端获取相关任务的推荐节目名单提供给电视前端子系统使用;并显示识别结果及推荐节目名单。在本发明实施例中,全方面收集用户观看电视时的情绪信息和对电视节目的反馈信息,并根据这些信息针对用户群构建适合用户观看的最佳节目列表,可以提高用户体验,使用户更愉悦地观赏电视节目。

Patent Agency Ranking