-
公开(公告)号:CN118233697B
公开(公告)日:2025-02-07
申请号:CN202410464923.6
申请日:2024-04-17
Applicant: 华院计算技术(上海)股份有限公司
IPC: H04N21/44 , H04N21/4402 , H04N21/845 , G06V40/16 , G06N3/08
Abstract: 传统的视频数据集切分方法主要依赖于手工标注,这一过程耗时耗力,且难以适应大规模视频数据处理的需求。本发明提供一种切分新闻主播视频数据集的方法、系统及电子设备,包括:获取用户提交的新闻主播视频;对所述新闻主播视频进行快速筛查,得到包含新闻主播和采访观众的人脸数据库;对所述包含新闻主播和采访观众的人脸数据库进行过滤,过滤掉采访观众的人脸数据,得到仅含新闻主播的人脸数据库;根据所述仅含新闻主播的人脸数据库,使用深度模型对所述新闻主播视频进行逐帧筛查,得到精确的新闻主播视频切分结果。以实现高精度、全自动的新闻主播视频切分。
-
公开(公告)号:CN119313789A
公开(公告)日:2025-01-14
申请号:CN202411304862.3
申请日:2024-09-18
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06T13/40 , G06F18/2431 , G06F18/21 , G06N3/0464 , G06N3/08 , G10L25/63 , G10L25/57
Abstract: 本发明提供一种带表情的数字人生成方法、系统、存储介质和程序产品,其中方法包括以下步骤:输入音频和相应图片;将音频输入到音频情绪提取网络提取相应的情绪类别;根据情绪类别从表情模板中抽取对应的模板;将模板和图片一起输入到生成网络生成相应的带表情基础图片;将基础图片经过处理以后,提取图像特征,同时对音频进行音频特征提取;将图像特征和音频特征输入到解码网络得到带表情的图片。本发明提供一种带表情的数字人生成方法、系统、存储介质和程序产品,能够通过引入相应的音频情绪提取和表情模板,实现对于带表情的,并且是多种表情变化的数字人生成任务。
-
公开(公告)号:CN119248916A
公开(公告)日:2025-01-03
申请号:CN202411303314.9
申请日:2024-09-18
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F40/30 , G06N5/04 , G06N5/022 , G06N3/0455
Abstract: 本发明提供一种自适应检索增强大语言模型构建和问答方法、系统、存储介质和程序产品,其中构建方法包括:收集问答数据,包括问题、标准答案和参考的上下文;使用大语言模型回答问题,得到初始答案;判断所述初始答案和标准答案是否一致,根据判断结果构建训练数据;基于所述训练数据,对大语言模型进行微调训练,得到自适应检索增强大语言模型。问答方法包括:输入问题;自适应检索增强大语言模型回答问题,并判断是否需要获取额外知识;根据判断结果,输出answer作为最终答案。本发明能够在资源利用和回答质量之间实现平衡,解决资源消耗大、问答效率低以及回答准确度差的问题。
-
公开(公告)号:CN119088947A
公开(公告)日:2024-12-06
申请号:CN202411206209.3
申请日:2024-08-30
Applicant: 浙江大学 , 华院计算技术(上海)股份有限公司
IPC: G06F16/335 , G06F16/33 , G06F16/35 , G06F18/2415 , G06F18/2431 , G06F18/27 , G06Q50/26
Abstract: 本发明公开了一种基层社会网格治理复杂事件机制智能推荐方法及装置,该方法包括:对接第三方信息化平台,以接口或数据库直连的方式获取基层社会网格治理的待处理事件,对所述待处理事件提取第一特征;采用繁简分类模型,基于所述第一特征,将所述待处理事件划分为简单事件或复杂事件;若所述待处理事件为复杂事件,则通过向量化检索和机器学习的方法为其推荐相应的处理机制,分别得到其属于各处理机制的第一概率和第二概率,对所述第一概率和第二概率进行排序,从而为其推荐概率最高的处理机制,可以实现对复杂事件的快速响应和有效处置。而智能化技术的运用则能够进一步提升治理的精准性和高效性,为基层社会治理注入新的活力。
-
公开(公告)号:CN118658515B
公开(公告)日:2024-12-06
申请号:CN202410682660.6
申请日:2024-05-29
Applicant: 华院计算技术(上海)股份有限公司
Abstract: 本发明公开了一种基于抗体结构微调的蛋白质大语言模型针对特定抗原设计新抗体的系统。一种训练抗体3D结构模型的系统,所述系统包括以下模块:(1)模型微调模块:该模块用于使用抗体序列数据库对蛋白质语言大模型进行微调;(2)抗体设计模块:该模块用于使用抗体序列微调后的蛋白质大语言模型进行目标抗体序列的优化和设计;(3)3D结构建模模块:该模块用于对优化和设计后的抗体序列进行3D结构建模。本发明的模型构建了从模型训练、抗体序列生成、抗体结构预测、抗原抗体对接的全过程,增加了抗体和特定抗原的亲和力与特异性,能大大缩短抗体筛选的时间,帮助企业加速抗体药物的研发。
-
公开(公告)号:CN118674995A
公开(公告)日:2024-09-20
申请号:CN202410909676.6
申请日:2024-07-09
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06V10/764 , G06V10/30 , G06V10/82 , G06V10/40 , G06N3/0464
Abstract: 本公开提供了一种图片的多标签分类方法、系统及电子设备。多标签分类方法包括:获取目标图片的第一图片特征;其中,第一图片特征包含冗余信息和噪音;基于多头注意力机制对第一图片特征进行压缩处理,以去除冗余信息,得到第二图片特征;基于稀疏编码对第二图片特征进行去噪处理,以得到目标图片特征;对目标图片特征所属的类别进行概率预测,以对目标图片进行多标签分类。基于多头注意力机制和稀疏编码依次对第一图片特征进行压缩和去噪处理,以去除第一图片特征中的以使得到的目标图片特征冗余信息和噪声,以使得到的目标图片特征只保留有价值的特征,进而使用该目标图片特征进行图片的多标签分类的效果更佳。
-
公开(公告)号:CN118658515A
公开(公告)日:2024-09-17
申请号:CN202410682660.6
申请日:2024-05-29
Applicant: 华院计算技术(上海)股份有限公司
Abstract: 本发明公开了一种基于抗体结构微调的蛋白质大语言模型针对特定抗原设计新抗体的系统。一种训练抗体3D结构模型的系统,所述系统包括以下模块:(1)模型微调模块:该模块用于使用抗体序列数据库对蛋白质语言大模型进行微调;(2)抗体设计模块:该模块用于使用抗体序列微调后的蛋白质大语言模型进行目标抗体序列的优化和设计;(3)3D结构建模模块:该模块用于对优化和设计后的抗体序列进行3D结构建模。本发明的模型构建了从模型训练、抗体序列生成、抗体结构预测、抗原抗体对接的全过程,增加了抗体和特定抗原的亲和力与特异性,能大大缩短抗体筛选的时间,帮助企业加速抗体药物的研发。
-
公开(公告)号:CN118657483A
公开(公告)日:2024-09-17
申请号:CN202410687885.0
申请日:2024-05-30
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06Q10/10 , G06N5/04 , G06F16/332
Abstract: 本公开提供一种工作流管理方法、系统、设备、介质和程序产品,工作流管理方法包括:响应于用户的输入触发,在不满足工作流停止条件时,通过训练好的深度学习语言表示模型从用户输入的信息中识别出需要跳转到的下一个工作流节点,并跳转到下一个工作流节点;通过训练好的大语言模型引导并提取用户提供当前工作流节点所需的信息,并存储提取出的信息;在已获得当前工作流节点所需的全部信息时完成执行当前工作流节点。本公开通过将大语言模型与传统的深度学习语言表示模型相结合的任务流管理,既能够基于人机对话交互模式辅助用户高效完成任务,又能够支持工作流的灵活扩展和节点间的准确地自由跳转,从而成为用户日常工作中不可或缺的可靠助手。
-
公开(公告)号:CN118646938A
公开(公告)日:2024-09-13
申请号:CN202410706471.8
申请日:2024-06-03
Applicant: 华院计算技术(上海)股份有限公司
IPC: H04N21/81 , H04N21/845 , H04N21/4402 , G06V40/20 , G06N3/0475 , G06N3/09
Abstract: 本公开提供了一种关键点生成方法及其模型的训练方法、视频生成方法。训练方法包括:获取训练样本;将训练样本输入关键点生成模型,根据关键点生成模型输出第一视频帧至第三视频帧之间的视频帧的关键点预测数据;根据目标关节点的运动约束条件、关键点样本数据和关键点预测数据计算损失误差;运动约束条件包括多个目标关节点中相邻两个目标关节点在各视频帧中的相对位置关系不变;根据损失误差调整关键点生成模型的网络参数,直至满足迭代停止条件。本公开通过关键点生成模型预测两帧视频帧中人物动作关键点,并根据目标关节点的运动约束条件、关键点样本数据和关键点预测数据计算损失误差,使关键点生成模型预测值与真实值更接近,预测更准确。
-
公开(公告)号:CN118569385A
公开(公告)日:2024-08-30
申请号:CN202410658940.3
申请日:2024-05-24
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06N5/04 , G06N5/025 , G06N3/045 , G06F16/332 , G06F16/33
Abstract: 本发明提供一种融合大语言模型的智能任务型对话方法,具体包括:获取与用户的对话;针对用户的输入信息进行识别解析,获取识别解析的结果;根据所述识别解析的结果同步更新对话状态追踪器的状态;根据追踪器的智能引导至恰当的对话场景节点;执行预先设定好的Action以完成特定的任务;基于当前对话节点情境和对话历史数据,生成机器人的反馈话术。本发明结合了大语言模型的强大能力,实现了场景的快速适应和高效配置。通过动态加载特定场景的配置信息,该系统能够按照预设的流程逻辑高效地推进轮对话过程,极大地简化了数据标注和模型训练的步骤。
-
-
-
-
-
-
-
-
-