-
公开(公告)号:CN116385270B
公开(公告)日:2024-08-16
申请号:CN202310412411.0
申请日:2023-04-18
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06T3/4007 , G06T3/4023 , G06T3/4046 , G06T3/04 , G06N3/0455 , G06N3/08 , G06N3/0464
Abstract: 本发明公开了一种基于多重损失和分辨率的图像转图像的方法,包括:获取输入图像,并对图像进行多分辨率预处理;将得到的不同分辨率图像输入到已经训练好的深度模型;其中,深度模型根据多个不同的分辨率,先从低分辨率模块至高分辨率模块依次进行训练,再进行整个模型的联合训练;在模型训练中,构造的损失函数包括:每个分辨率下的生成图像和真实图像之间的L1损失、由判别模型判断的生成图像是否真实的损失和生成图像和真实图像之间的风格损失;不同分辨率的图像通过深度模型进行整合最终得到相对应的图像。本发明充分利用图像的不同分辨率信息,结合应用多重损失训练好的深度模型,可以有效提高转换图像的质量。
-
公开(公告)号:CN117372553B
公开(公告)日:2024-05-10
申请号:CN202311085684.5
申请日:2023-08-25
Applicant: 华院计算技术(上海)股份有限公司
Abstract: 一种人脸图像生成方法及装置、计算机可读存储介质、终端,方法包括:确定人脸图像生成模型,包括图像编码子模型、音频编码子模型、音频映射子模型以及解码子模型;将驱动音频输入音频编码子模型,得到音频编码特征,以及将下半部分被遮挡的人脸图像输入图像编码子模型,得到人脸图像编码特征;将音频编码特征输入音频映射子模型,得到权重向量;采用权重向量,对预设的多个记忆口型编码特征进行加权运算,得到融合口型特征,其中,多个记忆口型编码特征对应于不同类型的口型;将音频编码特征、人脸图像编码特征以及融合口型特征,输入解码子模型,得到人脸生成图像。上述方案有助于提高人脸生成图像与驱动音频的口型匹配度。
-
公开(公告)号:CN117893579A
公开(公告)日:2024-04-16
申请号:CN202410098078.5
申请日:2024-01-23
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06T7/269 , G06T3/4038 , G06V10/80 , G06T5/50 , G06N3/0464 , G06N3/08 , G06F17/16
Abstract: 一种人物插帧图像生成方法及装置、计算机可读存储介质、终端,所述方法包括:获取第一图像的像素矩阵和第二图像的像素矩阵,并拼接得到第一拼接矩阵,所述第一图像和所述第二图像包含相同的目标人物;根据所述第一拼接矩阵预测得到所述目标人物的人体预测特征,以及对所述第一拼接矩阵进行特征提取,得到图像特征,所述人体预测特征包含所述目标人物在人物插帧图像所属时刻的预测人体信息;对所述目标人物的人体预测特征和所述图像特征进行特征融合,得到融合特征;对所述融合特征进行解码,得到所述人物插帧图像。上述方案有助于获得清晰度更高、质量更佳的人物插帧图像。
-
公开(公告)号:CN116664746B
公开(公告)日:2024-04-02
申请号:CN202310620674.0
申请日:2023-05-29
Applicant: 华院计算技术(上海)股份有限公司
Abstract: 一种人脸重建方法及装置、计算机可读存储介质、终端,所述方法包括:分别对原始人脸图像及其深度图像进行特征提取,得到人脸特征矩阵以及深度图特征矩阵;对所述人脸特征矩阵以及所述深度图特征矩阵进行拼接处理,得到融合特征矩阵;将所述融合特征矩阵输入预测模型,得到优化形状矩阵和优化表情矩阵;基于所述优化形状矩阵和所述优化表情矩阵,对初始化纹理矩阵和初始化光照控制矩阵进行迭代优化,以确定优化纹理矩阵和优化光照控制矩阵。采用上述方案有助于改进人脸重建的效果。
-
公开(公告)号:CN116384412B
公开(公告)日:2024-03-29
申请号:CN202310172048.X
申请日:2023-02-24
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06F40/35 , G06F40/30 , G06N3/0455
Abstract: 一种对话内容生成方法及装置、计算机可读存储介质、终端,所述方法包括:获取用户输入的当前话语;获取预设人物的多条偏好数据,所述多条偏好数据用于描述所述预设人物的行为偏好和/或认知偏好;根据所述多条偏好数据、所述当前话语和对话上下文历史,生成输入文本;将所述输入文本输入至预先训练得到的回复生成模型,得到所述回复生成模型输出的所述当前话语的回复内容。通过本申请提供的方案,能够在多轮对话中生成对话风格统一的回复内容。
-
公开(公告)号:CN117372553A
公开(公告)日:2024-01-09
申请号:CN202311085684.5
申请日:2023-08-25
Applicant: 华院计算技术(上海)股份有限公司
Abstract: 一种人脸图像生成方法及装置、计算机可读存储介质、终端,方法包括:确定人脸图像生成模型,包括图像编码子模型、音频编码子模型、音频映射子模型以及解码子模型;将驱动音频输入音频编码子模型,得到音频编码特征,以及将下半部分被遮挡的人脸图像输入图像编码子模型,得到人脸图像编码特征;将音频编码特征输入音频映射子模型,得到权重向量;采用权重向量,对预设的多个记忆口型编码特征进行加权运算,得到融合口型特征,其中,多个记忆口型编码特征对应于不同类型的口型;将音频编码特征、人脸图像编码特征以及融合口型特征,输入解码子模型,得到人脸生成图像。上述方案有助于提高人脸生成图像与驱动音频的口型匹配度。
-
公开(公告)号:CN114942991B
公开(公告)日:2023-04-21
申请号:CN202210240916.9
申请日:2022-03-10
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06F16/35 , G06F18/2431 , G06N3/044 , G06N3/0499 , G06N3/08
Abstract: 本发明提供了一种基于隐喻识别的情感分类模型构建方法,涉及计算机应用技术领域,包括:构建隐喻训练语料集,基于第一预训练语言模型训练获得隐喻识别模型;构建情感分类语料集,分别输入第二预训练语言模型和隐喻识别模型提取情感分类语料集中文本的显式特征值和隐喻信息特征值;结合显式特征值和隐喻信息特征值获得综合特征值,输入前馈神经网络和二分类softmax层,获得情感分类结果;基于情感分类结果,采用BP算法进行优化训练,获得最优的情感分类模型。本发明综合考虑了显式和隐式情感表达,更全面地分析了不同层面的文本情感信息,给出更加准确和可信的情感分类模型。
-
公开(公告)号:CN114942991A
公开(公告)日:2022-08-26
申请号:CN202210240916.9
申请日:2022-03-10
Applicant: 华院计算技术(上海)股份有限公司
Abstract: 本发明提供了一种基于隐喻识别的情感分类模型构建方法,涉及计算机应用技术领域,包括:构建隐喻训练语料集,基于第一预训练语言模型训练获得隐喻识别模型;构建情感分类语料集,分别输入第二预训练语言模型和隐喻识别模型提取情感分类语料集中文本的显式特征值和隐喻信息特征值;结合显式特征值和隐喻信息特征值获得综合特征值,输入前馈神经网络和二分类softmax层,获得情感分类结果;基于情感分类结果,采用BP算法进行优化训练,获得最优的情感分类模型。本发明综合考虑了显式和隐式情感表达,更全面地分析了不同层面的文本情感信息,给出更加准确和可信的情感分类模型。
-
公开(公告)号:CN119889551A
公开(公告)日:2025-04-25
申请号:CN202510060705.0
申请日:2025-01-14
Applicant: 华院计算技术(上海)股份有限公司
Abstract: 本发明提供一种人格评估系统设计方法、装置、存储介质和程序产品,涉及自然语言处理技术领域及心理学人格评估技术领域。其中,人格评估系统设计方法包括:管理用户注册与登录,并控制对评估结果的访问权限;采集数据并对数据进行预处理;使用大语言模型分析经过预处理的数据,得到评估数据;设定人格评估体系,对所述评估数据进行特征提取,生成实时特征维度评分;根据实时特征维度评分生成定期解析报告,并根据用户反馈调整解析报告;对数据传输和存储进行加密处理,确保数据安全。本发明基于心理学人格评估的相关理论与方法,利用大语言模型的语义理解和情感分析能力进行人格评估,实现了使用指定的人格评估体系进行精准、便捷和实时的评估。
-
公开(公告)号:CN119888415A
公开(公告)日:2025-04-25
申请号:CN202411908024.7
申请日:2024-12-23
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06V10/776 , G06V10/26 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/084 , G06T7/11 , G06T7/13
Abstract: 本发明提供一种抠像精度专家判别方法、系统、存储介质和程序产品,其中方法包括:获取真值蒙版图;使用边界检测技术识别真值蒙版图的边界区域,随机决定添加干扰项,得到处理好的训练数据集;对处理好的训练数据集使用ViT模型作为骨干网络进行训练,得到专家判别器;使用专家判别器通过评分机制对抠像模型生成的边界区域进行评估;将专家判别器的评分结果反馈到抠像模型中,作为损失函数的一部分,帮助抠像模型提升边界处理的精确度。本发明能够显著提高细微边界的分割精度,特别是在处理细小、复杂场景时,最终输出的前景图像或视频边界更加清晰、准确,实现了更为精准的边界分割。
-
-
-
-
-
-
-
-
-