人脸图像生成方法及装置、计算机可读存储介质、终端

    公开(公告)号:CN117372553A

    公开(公告)日:2024-01-09

    申请号:CN202311085684.5

    申请日:2023-08-25

    Abstract: 一种人脸图像生成方法及装置、计算机可读存储介质、终端,方法包括:确定人脸图像生成模型,包括图像编码子模型、音频编码子模型、音频映射子模型以及解码子模型;将驱动音频输入音频编码子模型,得到音频编码特征,以及将下半部分被遮挡的人脸图像输入图像编码子模型,得到人脸图像编码特征;将音频编码特征输入音频映射子模型,得到权重向量;采用权重向量,对预设的多个记忆口型编码特征进行加权运算,得到融合口型特征,其中,多个记忆口型编码特征对应于不同类型的口型;将音频编码特征、人脸图像编码特征以及融合口型特征,输入解码子模型,得到人脸生成图像。上述方案有助于提高人脸生成图像与驱动音频的口型匹配度。

    一种辅助无人系统视觉决策的解释序列产生方法

    公开(公告)号:CN115272782A

    公开(公告)日:2022-11-01

    申请号:CN202111613040.X

    申请日:2021-12-27

    Applicant: 复旦大学

    Abstract: 本发明提供一种辅助无人系统视觉决策的解释序列产生方法,为无人系统的监督任务提供层次化的决策依据,赋予系统决策透明性,方便开发者持续优化模型,其特征在于,包括以下步骤:步骤S1,将图像数据输入至预训练好的卷积神经网络模型获取最后一层的特征图张量以及每一层梯度信息;步骤S2,基于特征图张量和每一层梯度信息,采用人工智能可解释方法,获取决策显著图集合;步骤S3,基于决策显著图集合获取激活的输入数据图像集合;步骤S4,将激活的输入数据图像集合输入至预训练好的卷积神经网络模型,采用全局工作空间映射获取各显著图组对应的权重系数;步骤S5,基于各显著图组对应的权重系数合成显著图,并基于权重系数的预定顺序得到决策序列。

    基于常识自适应选择的共情对话方法及系统

    公开(公告)号:CN115905485A

    公开(公告)日:2023-04-04

    申请号:CN202211422630.9

    申请日:2022-11-14

    Applicant: 复旦大学

    Abstract: 本发明提供一种基于常识自适应选择的共情对话方法及系统,首先利用神经网络的表征能力,通过感知对话的上下文情感识别信息,编码得到历史对话的上下文信息与常识图谱的先验信息。然后将编码得到的特征信息通过工作空间基于选择常识特征编码算法进行筛选,自适应地统一情感认知信息,确保筛选出的常识特征编码与历史对话的上下文情感识别信息的一致性,从而输出更符合使用者感受的共情对话文本。本发明利用对话中的情感信息来辅助理解对话意图,这样既提升了上下文的理解能力,又能让使用者觉得自身情绪状态被理解,从而提升沟通效率和用户体验。而且本发明还可以应用到各类无人系统或人机交互场景,具有适用范围广、使用价值高的优点。

Patent Agency Ranking