-
公开(公告)号:CN119810258A
公开(公告)日:2025-04-11
申请号:CN202411856077.9
申请日:2024-12-16
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06T11/60 , G06T5/77 , G06T5/60 , G06T3/4038 , G06T3/4046 , G06V40/20 , G06V10/82
Abstract: 本发明提供一种动作迁移模型设计方法、装置、存储介质和程序产品,涉及计算机视觉技术领域。其中,动作迁移模型设计方法包括:训练掩图提取模型;获取两张人体图像,一张为原始图像I,另一张为驱动图像T;从原始图像中提取原始肢体掩图和原始肢体图像;从驱动图像中提取驱动肢体掩图;依据所述驱动肢体掩图,对原始肢体掩图及原始肢体图像进行变换,得到目标肢体掩图和目标肢体图像;使用动作生成模块生成目标人体图像;使用背景生成模块生成目标背景图像;使用合成模块生成最终图像。本发明提高了动作迁移图像生成的整体精确性和图像质量,避免了相关生成瑕疵和错误的出现。
-
公开(公告)号:CN119741541A
公开(公告)日:2025-04-01
申请号:CN202411806242.X
申请日:2024-12-09
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06V10/764 , G06V10/82 , G06V10/26 , G06V10/44 , G06N3/0464 , G06N3/08 , G06T7/00 , G06T7/10
Abstract: 本发明提供一种飞钢检测方法、系统、存储介质和程序产品,其中方法包括:获取实时的视频流图像数据;使用目标检测模型进行飞钢目标检测;使用图像灰度值统计特征和分类模型进行浓雾下飞钢目标综合识别;基于飞钢目标检测结果和浓雾下飞钢目标综合识别结果进行综合判定;当综合判定结果为飞钢正在发生时,向服务器端发出报警,开启飞剪装置进行剪断,并进行日志与数据记录;进行用户反馈与模型增量学习。本发明可以提升飞钢的检测准确率、降低系统误判率,增加算法的鲁棒性,提升模型对场景变化的适应能力,在实际生产环境中,可以降低生产安全事故率、降低飞钢带来的时间、生产成本等损耗,维持生产效率与效益,提高能源利用率。
-
公开(公告)号:CN117893579B
公开(公告)日:2025-02-25
申请号:CN202410098078.5
申请日:2024-01-23
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06T7/269 , G06T3/4038 , G06V10/80 , G06T5/50 , G06N3/0464 , G06N3/08 , G06F17/16
Abstract: 一种人物插帧图像生成方法及装置、计算机可读存储介质、终端,所述方法包括:获取第一图像的像素矩阵和第二图像的像素矩阵,并拼接得到第一拼接矩阵,所述第一图像和所述第二图像包含相同的目标人物;根据所述第一拼接矩阵预测得到所述目标人物的人体预测特征,以及对所述第一拼接矩阵进行特征提取,得到图像特征,所述人体预测特征包含所述目标人物在人物插帧图像所属时刻的预测人体信息;对所述目标人物的人体预测特征和所述图像特征进行特征融合,得到融合特征;对所述融合特征进行解码,得到所述人物插帧图像。上述方案有助于获得清晰度更高、质量更佳的人物插帧图像。
-
公开(公告)号:CN119339423A
公开(公告)日:2025-01-21
申请号:CN202411435650.9
申请日:2024-10-15
Applicant: 华院计算技术(上海)股份有限公司
Abstract: 本公开提供了一种人脸融合方法、系统、设备、介质和程序产品,该人脸融合方法包括:获取至少两张待融合人脸图像的实际关键点;基于预设关键点和实际关键点,得到待融合人脸图像对应的位置调整系数;基于位置调整系数对待融合人脸图像进行调整,以得到调整后的待融合人脸图像;对调整后的待融合人脸图像进行人脸融合处理,以得到目标人脸融合图像。本公开通过预设关键点和待融合人脸图像的实际关键点,以得到位置调整系数,根据位置调整系数对待融合人脸图像进行调整,再进行人脸融合处理,改善了人脸融合图像的质量,提升了融合效果,降低了人脸融合处理的难度和资源消耗。
-
公开(公告)号:CN119238533A
公开(公告)日:2025-01-03
申请号:CN202411651055.9
申请日:2024-11-18
Applicant: 华院计算技术(上海)股份有限公司
IPC: B25J9/16
Abstract: 本发明提供一种人形机器人控制方法、系统、存储介质和程序产品,属于计算机视觉领域。其中方法包括:预处理专家动作数据,将专家动作数据处理成和目标机器人骨骼架构相当的专家数据;在仿真环境中采用人形结构搭建机器人,配置机器人的关节参数,每个关节自由度由独立的物理控制模块进行控制;构建机器人的策略表征方法,包括状态空间、动作空间、奖励函数、多帧式控制方式;对机器人进行初始化;最小化每帧上的机器人动作与专家动作间的差异,最大化奖励函数,驱动机器人学习。本发明可以辅助人形机器人的学习过程,使得机器人可以在完成任务的同时拟人化,并且训练速度有所提升。
-
公开(公告)号:CN118840414A
公开(公告)日:2024-10-25
申请号:CN202411038198.2
申请日:2024-07-30
Applicant: 华院计算技术(上海)股份有限公司
Abstract: 本发明提供一种视觉Transformer模型设计方法、装置、存储介质和程序产品,其中,方法包括:设定最小形变图像的大小和最小区域块的大小;根据原图的宽高,得到原图的长边与短边之比取整的值,确定形变目标图像的一边长和待划分区域块的一边长;根据原图的长边与短边之比取整的值,计算出形变目标图像的宽高和待划分区域块的宽高;根据形变目标图像的宽高和待划分区域块的宽高,对图像进行形变和划分,得到若干区域块,送入Transformer结构中。将每个区域块划分成若干方块,对所述若干方块进行编码,得到每个区域块特征;整合所有的区域块特征,送入Transformer结构中进行训练。本发明可以在较少形变情况下提取更符合原始图像的特征信息。
-
公开(公告)号:CN118708721A
公开(公告)日:2024-09-27
申请号:CN202410116679.4
申请日:2024-07-05
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06F16/35 , G06F16/36 , G06F40/295
Abstract: 本发明提供一种基于多类文本表征的知识分类树融合方法及计算机可读存储介质,包括:获取知识体系进行知识表示,获得知识分类树;基于所述知识分类树进行文本向量化表征,获得知识向量;基于所述知识向量,进行知识融合;基于所述知识融合,进行知识存储;基于所述知识存储,进行知识可视化。跨知识体系的融合的方法大多是基于规则,对于复杂的知识结点表示效果不佳。知识分类树只能表示上下位关系,无法提供丰富的语义信息。针对上述问题,本发明提出了一种基于多类文本表征的知识分类树融合方法及计算机可读存储介质,使得整个知识分类树融合流程完备,自动化程度高,可信性强,还兼具了知识体系树可视化的功能,能够更清晰地浏览整个知识体系。
-
公开(公告)号:CN118585876A
公开(公告)日:2024-09-03
申请号:CN202410487378.2
申请日:2024-04-22
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06F18/241 , G06F18/2415 , G06F18/25 , G06V10/44 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/047
Abstract: 本发明提供一种基于缺陷描述的缺陷分类方法及系统,其中方法包括以下步骤:获得缺陷图像和对应的缺陷描述文本;将所述缺陷图像送入视觉编码器中进行编码,得到视觉特征;将所述缺陷描述文本送入语义编码器中进行编码,得到语义特征;将所述视觉特征送入多层感知机,经过激活函数,得到在每个候选标签上的概率预测p1,计算损失L1;将所述视觉特征和所述语义特征进行融合后,经过激活函数,得到在每个候选标签上的概率预测p2,计算损失L2;对所述损失L1和所述损失L2进行融合,得到最终损失;对所述概率预测p1和所述概率预测p2进行融合,取融合后最大概率值所属标签为缺陷预测结果。本发明能够更加准确地界定不同类别之间的区别,提高分类的准确率。
-
公开(公告)号:CN117610510B
公开(公告)日:2024-09-03
申请号:CN202311629235.2
申请日:2023-11-30
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06F40/166 , G06N5/04
Abstract: 本公开提供了一种对话引导信息的生成及问答方法、系统、智能对话机器人,该对话引导信息的生成方法包括:基于预设数据集筛选获得若干个目标对话案例,每个目标对话案例对应一个对话主题,且若干个所述目标对话案例对应的所述对话主题相同,对若干个所述目标对话案例进行案例标准化处理,得到若干个标准对话案例,基于预设规则对若干个所述标准对话案例进行拼接,生成所述对话引导信息,其中,所述对话引导信息用于激发大语言模型的逻辑推理能力,帮助大语言模型生成有逻辑的、情感统一的对话回复,可控性高、体验性好。
-
公开(公告)号:CN117218224B
公开(公告)日:2024-09-03
申请号:CN202311057116.4
申请日:2023-08-21
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06T11/00 , G06V40/16 , G06V10/80 , G06V10/774 , G06V10/771
Abstract: 一种人脸情绪图像生成方法及装置、可读存储介质、终端,所述方法包括:对目标情绪文本以及输入音频分别进行编码,以得到情绪特征向量和语音特征向量序列;将情绪特征向量分别与每个语音特征向量进行融合,得到融合特征向量序列;将融合特征向量序列输入预训练的表情预测模型,以得到第一人脸表情向量序列;基于第一人脸表情向量序列和第二人脸表情向量序列进行渲染,以得到渲染人脸图像序列,所述第二人脸表情向量序列是根据与所述语音特征向量序列时序对齐的原始人脸图像序列确定的;将渲染人脸图像序列和所述情绪特征向量输入预训练的图像映射模型,以生成人脸情绪图像序列。上述方案有助于获得情绪状态更加自然且符合预期的人脸情绪图像。
-
-
-
-
-
-
-
-
-