-
公开(公告)号:CN118503645A
公开(公告)日:2024-08-16
申请号:CN202410434377.1
申请日:2024-04-11
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06F18/20 , G06F18/2433 , G06Q10/04 , G06Q50/04
Abstract: 本公开提供了一种基于认知智能时空对齐的钢轧数据处理方法及系统,其中,钢轧数据处理方法包括:获取目标钢材在连铸过程中的第一异常事件对应的第一实时位置;基于目标对齐系数和所述第一实时位置预测所述目标钢材在轧钢过程中的第二异常事件对应的第二实时位置;所述目标对齐系数根据样本钢材在连铸过程中的第一异常事件对应的第一历史位置和所述样本钢材在轧钢过程中的第二异常事件对应的第二历史位置计算得到,用于表征钢材轧钢前后的延伸程度。本公开获得了连铸和轧钢过程中异常事件间的对齐关系,实现了对轧钢过程中数据的预测,节省了轧钢过程中数据采集的步骤,降低了制造成本,节约了资源。
-
公开(公告)号:CN118158488A
公开(公告)日:2024-06-07
申请号:CN202410138544.8
申请日:2024-01-31
Applicant: 华院计算技术(上海)股份有限公司
IPC: H04N21/81 , H04N21/233 , H04N21/234 , H04N21/25
Abstract: 本发明公开一种视频生成方法及装置,该方法包括:接收用户提交的视频文件和音频文件,视频文件的所有视频帧包含人脸图像;分别对视频文件和音频文件按照设定长度进行切分,得到多个一一对应的原始视频片段和原始音频片段;获取与各原始音频片段对应的音频特征;将原始视频片段和对应的音频特征两两一组输入深度学习模型进行人像口型渲染,得到渲染后的视频图像;将视频图像与所述原始音频片段进行时间对齐后输出。利用本发明方案,可以快速高效地生成虚拟人脸视频,提升用户对虚拟现实产品的实时体验。
-
公开(公告)号:CN117074643B
公开(公告)日:2024-06-07
申请号:CN202311056901.8
申请日:2023-08-21
Applicant: 华院计算技术(上海)股份有限公司
Inventor: 包忞立
IPC: G01N33/22 , G06V10/764 , G06V10/77 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/08 , G06Q10/0639 , G06Q50/02 , G01N21/84
Abstract: 本公开提供一种煤质评价方法、系统、设备和介质,所述煤质评价方法包括:获取待评价煤的多模态数据;分别对所述多模态数据中的各个模态数据进行特征提取,确定与各个模态数据分别对应的目标特征;根据所述目标特征确定各个所述目标特征所分别对应的目标评价结果,并根据所述目标评价结果确定最终的煤质评价结果。本公开通过获取待评价煤的多模态数据,以获取多维度的目标特征,并且根据所述目标特征以及历史数据,确定最终的所述煤质评价。可使评价信息更丰富,并提高评价精度。同时,仅需要待评价煤的目标特征即可确定评价信息,提高煤质评价的处理效率。
-
公开(公告)号:CN118135321A
公开(公告)日:2024-06-04
申请号:CN202410316767.9
申请日:2024-03-19
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06V10/764 , G06V20/70 , G06V10/80 , G06V10/774 , G06T7/00 , G06V10/82
Abstract: 本发明提供一种基于样本标注质量修正的图像分类算法、系统、设备及介质,其特征在于,包括:获取已标注图片,进行样本标注质量评分,生成较为全面的样本标注质量评估;基于所述样本标注质量评估,进行样本标注质量评分融合,生成每个样本标注的质量评分;基于所述样本标注的质量评分,进行样本质量的图像分类模型修正,生成样本质量模型修正图像分类模型。现有的方法难以基于样本标注质量科学地调整这些权重,并将其有效地整合到图像分类模型中。本发明提出了一种基于样本标注质量修正的图像分类算法,解决在没有任何先验知识的情况下,实现图像的数据样本质量判定以及模型优化,量化了图像样本标注质量,并基于样本质量评分,提升了图像分类模型的效果。
-
公开(公告)号:CN118113850A
公开(公告)日:2024-05-31
申请号:CN202410350589.1
申请日:2024-03-26
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06F16/332 , G06F16/33 , G06N20/00 , G06F16/35 , G06F16/335 , G06F18/22 , G06F18/25
Abstract: 本公开提供了一种产品类目的匹配方法及其模型生成方法、装置、电子设备。该生成方法包括:获取每一待匹配产品名称的候选产品类目集合、每一待匹配产品名称的若干个提示语句及若干个数据对;根据提示语句、候选产品类目集合及数据对构建每一待匹配产品名称的提示文本;根据提示文本以及与提示文本对应的回答文本构建微调样本;使用微调样本微调预训练的大语言模型,以生成产品类目匹配模型。本发明使预训练的大语言模型经过微调后能够更好的处理产品类目匹配这一特定任务,使生成的产品类目匹配模型能够在执行产品类目匹配时输出更加稳定。
-
公开(公告)号:CN118101874A
公开(公告)日:2024-05-28
申请号:CN202410350644.7
申请日:2024-03-26
Applicant: 华院计算技术(上海)股份有限公司
Inventor: 罗粤清
IPC: H04N7/01 , G06N3/0464 , G06N3/08
Abstract: 本公开提供了一种视频的插帧方法及插帧模型的训练方法,插帧方法包括:将第一视频的首帧图像和第二视频的尾帧图像的分辨率降低;对分辨率降低后的首帧图像和尾帧图像进行补帧处理,得到第一中间帧图像;对第一中间帧图像进行分辨率增强处理,以得到增强后的第一中间帧图像;将增强后的第一中间帧图像插入至第一视频和第二视频的首尾连接处,以完成视频的插帧。本公开对较低分辨率的图像进行插帧,相比起高分辨率,低分辨率图像的像素点的位移较小,插帧的效果更好,提高插帧的精准度,同时对较低分辨率的图像进行插帧,可以减小模型的计算量,提高模型的计算效率。
-
公开(公告)号:CN118072735A
公开(公告)日:2024-05-24
申请号:CN202410194535.0
申请日:2024-02-21
Applicant: 华院计算技术(上海)股份有限公司
IPC: G10L15/26 , G10L25/51 , G10L21/007
Abstract: 本发明提供一种自动化的音频处理及修复的数据预处理方法及系统,其中方法包括:收集用户音频和对应标准文本;对所述用户音频进行预处理,得到预处理音频、音频识别文本、所述音频识别文本对应的时间戳;将所述用户音频切分成仅含单字的单字音频片段并存入数据库;将所述音频识别文本与所述对应标准文本进行差异比对,通过动态规划计算最小编辑距离的处理路径,得到每个待处理音频的最佳处理方式;对每个所述待处理音频进行有限次循环处理,拼接得到处理后的音频;修复所述处理后的音频,得到修复后的音频。本发明能够极大地减少人力劳动成本与时间成本。
-
公开(公告)号:CN118035413A
公开(公告)日:2024-05-14
申请号:CN202410161006.0
申请日:2024-02-04
Applicant: 华院计算技术(上海)股份有限公司
Inventor: 史可欢
IPC: G06F16/332 , G06F16/33 , G06F16/335 , G06N5/04
Abstract: 本申请提供了一种问答方法及装置、存储介质、计算设备,问答方法包括:获取多跳问题,并将多跳问题拆分为多个单跳问题;将多个单跳问题中第一个单跳问题与知识库中的各个文本向量进行语义匹配,以获得对应的检索结果;迭代地将检索结果替换下一个单跳问题的主语,并将替换后的单跳问题与知识库中的各个文本向量进行语义匹配,直至遍历完成多个多跳问题,获得参考答案;将参考答案与多跳问题输入至大语言模型,以获得多跳问题的答案。本申请提供了一种提升多跳问题的问答准确性的方案。
-
公开(公告)号:CN116863034B
公开(公告)日:2024-05-14
申请号:CN202310850135.6
申请日:2023-07-11
Applicant: 华院计算技术(上海)股份有限公司
Abstract: 本发明提供一种提升扩散模型图片生成效果的方法,涉及计算机技术领域,包括:给定预训练的文本编码器并输入文字描述;将文本编码器内部注意力机制的尺度因子替换为稳定尺度因子,得到新的文本编码器;根据文字描述及新的文本编码器得到文本编码,利用扩散模型获得文本编码的编码文本向量;基于编码文本向量,通过解码模型得到输入的文字描述的生成图片。本发明使用稳定尺度因子,在文本生成图像领域中自适应地调节尺度因子,从而实现自然的高保真的生成图片,最终提升扩散模型生成效果。
-
公开(公告)号:CN118015110A
公开(公告)日:2024-05-10
申请号:CN202311762681.0
申请日:2023-12-19
Applicant: 华院计算技术(上海)股份有限公司
Abstract: 一种人脸图像生成方法及装置、计算机可读存储介质、终端,所述方法包括:确定人脸图像生成模型,人脸图像生成模型包括音频内容特征提取子模型、音频情感特征提取子模型、扩散子模型;将驱动音频分别输入音频内容特征提取子模型和音频情感特征提取子模型进行特征提取,得到音频内容特征和音频情感特征;至少基于音频内容特征和音频情感特征进行拼接,得到音频融合特征;将所述音频融合特征和带噪声的参考人脸图像特征输入所述扩散子模型进行去噪处理,得到目标完整人脸特征;对目标完整人脸特征进行解码,得到完整人脸生成图像。上述方案有助于生成既能准确匹配驱动音频中的口型,又能精准表达驱动音频包含的情绪的人脸生成图像。
-
-
-
-
-
-
-
-
-