基于残差的深度学习方法及神经网络模型

    公开(公告)号:CN116011547A

    公开(公告)日:2023-04-25

    申请号:CN202310092429.7

    申请日:2023-01-17

    Abstract: 本说明书实施例提供了基于残差的深度学习方法及神经网络模型。其中,神经网络模型包括多个网络层,每个网络层包括卷积层、动态残差模块和样本表征调整模块,动态残差模块包括相似度子模块。在深度学习方法中,获取训练样本的初始表征;神经网络模型中的各个网络层按照以下方式执行,直至针对神经网络模型的学习完成:将初始表征以及当前网络层中待处理的第一样本表征输入至当前网络层中的相似度子模块,输出相似度表征;将第一样本表征输入当前网络层中的卷积层,输出第二样本表征;以及将第二样本表征、动态残差以及初始表征输入样本表征调整模块,输出第三样本表征。

    一种生成对话下文的方法和系统

    公开(公告)号:CN111382257A

    公开(公告)日:2020-07-07

    申请号:CN202010470216.X

    申请日:2020-05-28

    Abstract: 本说明书实施例公开了一种生成对话下文的方法及系统。所述方法包括:获取对话上文,根据所述对话上文获取与所述对话上文相关的至少一个知识文本,并生成所述至少一个知识文本对应的至少一个知识向量k1~km;所述知识文本存储在知识库中;根据至少一个所述知识向量k1~km和当前时刻的解码隐藏状态St,使用第一注意力模型生成当前时刻的知识融合向量 ;基于所述当前时刻的知识融合向量、当前时刻的上下文向量 以及所述当前时刻的解码隐藏状语组态S成t,所生述成对当话前下时文刻,所的述对y话1表下示文t词=1时语的yt;对y1话~y下t的文对词话语下。文词

Patent Agency Ranking