-
公开(公告)号:CN119167940A
公开(公告)日:2024-12-20
申请号:CN202411054769.1
申请日:2024-08-01
Applicant: 浙江大学
IPC: G06F40/30 , G06N5/04 , G06N3/0455 , G06N3/0464 , G06N3/042 , G06N3/0499 , G06N3/092 , G06V20/70 , G06V10/82 , G06T11/60
Abstract: 本发明公开了一种基于场景图的文生图大模型提示词优化方法、电子设备、介质,包括:获取第一提示词,解析得到第一场景图;将第一提示词输入至文生图大模型中,生成对应的第一图片;将第一场景图与第一图片进行语义对齐得到第二场景图;将第一提示词以及第二场景图输入至预先训练好的提示词优化模型中,输出第二提示词;包括:对第一提示词进行编码得到文本特征,对第二场景图进行编码、卷积得到语义特征;将文本特征、语义特征拼接后输入至文本编辑解码器,输出至少包括删除、重排、插入在内的动作;基于输出的删除、重排、插入动作对第一提示词进行处理,得到第二提示词。
-
公开(公告)号:CN118093597A
公开(公告)日:2024-05-28
申请号:CN202410490193.7
申请日:2024-04-23
Applicant: 浙江大学
IPC: G06F16/22 , G06F16/242 , G06F18/22
Abstract: 本发明公开了一种表格数据重构方法及装置、问答方法,包括筛选出与用户问题有关的表头并保留该表头所在的列,得到列重构表格;对列重构后的表格进行行重构:根据单元值将表格的列划分为三类,即连续值列、离散值列、时间值列;提取连续值列的统计量、离散值列的与用户问题有关的类别以及时间值列的最早和最晚时间作为表格的重构特征,并将这些重构特征进行连接得到行重构表格,从而得到完整的重构表格;进一步地,输入大语言模型来生成符合用户问题需求的SQL语句,大大提高了通过自然语言处理表格任务的准确率,在实际的使用场景更加智能与有效。
-
公开(公告)号:CN118015345A
公开(公告)日:2024-05-10
申请号:CN202410098720.X
申请日:2024-01-24
Applicant: 浙江大学
IPC: G06V10/764 , G06V10/774 , G06F17/16 , G06N3/088
Abstract: 本发明公开了一种图片黑盒领域自适应分类方法、电子设备、介质,包括:将待分类的目标域图片数据输入至预先训练好的目标域分类器,预测输出标签结果;其中,目标域分类器的训练过程包括:获取第一图片和第二图片;基于第一图片和第二图片在目标域分类器的输出与其对应的标签,计算有标签图片分类损失;基于图片及其对应的增强副本构建特征相似度矩阵,基于图片的潜在标签构建标签相关性矩阵,从而计算对比损失;计算无标签图片的猜测标签,基于无标签图片的目标域预测标签以及猜测标签计算无标签图片分类损失;将有标签图片分类损失、对比损失、无标签图片分类损失之和作为损失函数,基于该损失函数训练目标域分类器。
-
公开(公告)号:CN117924417A
公开(公告)日:2024-04-26
申请号:CN202311815127.4
申请日:2023-12-27
Applicant: 浙江大学
Abstract: 本发明公开了三种抗鲍曼不动杆菌肽及其应用,这三种抗鲍曼不动杆菌肽的氨基酸序列分别为:R‑R‑W‑W‑R‑I‑W‑NH2,R‑W‑W‑R‑W‑I‑NH2,R‑R‑W‑I‑R‑W‑I‑T‑NH2。这三种抗鲍曼不动杆菌肽对鲍曼不动杆菌具有强力的杀菌性能,并保证较小的细胞毒性以及溶血性,且实际成本低,可用于制备治疗和/或预防鲍曼不动杆菌等细菌感染的药物。
-
公开(公告)号:CN116416551A
公开(公告)日:2023-07-11
申请号:CN202310019359.2
申请日:2023-01-06
Applicant: 浙江大学计算机创新技术研究院
Abstract: 本发明公开了一种基于跟踪算法的视频图像多人自适应跳绳智能计数方法。在相机的视野实时拍摄多人跳绳的视频,开始前测试者作出举手动作,举手动作后再进行跳绳,通过举手动作触发人脸识别算法人脸识别获得身份;记录初始位置在跳绳过程中跟踪算法实时动态追踪位置,基于视频获取所有测试者的骨骼关键点,根据跟踪算法的位置信息区分骨骼关键点对应的测试者,再进行波形分析得到实时的跳绳计数。本发明通过跟踪算法实时追踪跳绳测试同学的位置;多人跳绳测试的信号分开触发,多人分别计数,可实现动态和静态的一至多人的同时跳绳测试,能更好适用于实际复杂场景,能过滤非跳绳测试人员的干扰,使用方便且精度高。
-
公开(公告)号:CN115577872A
公开(公告)日:2023-01-06
申请号:CN202211164902.X
申请日:2022-09-23
Applicant: 浙江大学计算机创新技术研究院
Abstract: 本发明公开了一种基于多能智能体深度强化学习的结构化数据预测优化方法。获取结构化数据的原始数据;用深度强化学习智能体和代理模型对原始数据进行迭代处理,获得优化后的深度强化学习智能体;将原始数据和初始设定的超参数再次输入到优化后的深度强化学习智能体中生成新训练数据,并用新训练数据训练一个预测模型;将结构化数据的待预测数据输入输入到预测模型中,得到最终的预测目标参数的预测结果。本发明能够一次性解决包括自动特征工程、超参搜索等多个优化任务,大幅降低建模过程中的人力消耗,同时提高寻优的准确度。
-
公开(公告)号:CN119990321A
公开(公告)日:2025-05-13
申请号:CN202510120065.8
申请日:2025-01-25
Applicant: 浙江大学计算机创新技术研究院
IPC: G06N5/04 , G06N20/00 , G06N3/09 , G06N3/092 , G06F18/214 , G06F8/30 , G06F11/3604 , G06F16/2452
Abstract: 本发明公开了一种针对表格问答大模型的训练方法及系统。表格问答任务是指根据提供的表格数据例如csv文件,excel文件,数据库db数据等表格形式数据,针对表格数据提出数据查询,数据统计分析,可视化等表格相关的问题,通过Python或SQL代码能够执行得到答案的问答任务。本发明结合表格问答领域的特点提出了一种针对表格问答任务的大语言模型增强训练方法,在已有的大语言模型基础上,通过构建表格问答任务相关的专门数据集,设计结合表格问答的符合奖励反馈系统,结合镜像模型的强化学习训练策略,增强大语言模型在表格数据问答上的能力。
-
公开(公告)号:CN119990085A
公开(公告)日:2025-05-13
申请号:CN202510160821.X
申请日:2025-02-13
Applicant: 浙江大学计算机创新技术研究院
IPC: G06F40/18 , G06F18/214 , G06N3/045 , G06N3/088 , G06N3/0895
Abstract: 本发明公开了一种基于表格置换不变性的预训练方法和装置。该方法包括第一阶段根据表格中行、列的置换不变性构造正负样本对数据,然后用对比学习的方法构建预训练任务;为了让预训练模型适应各种各样的下游任务,第二阶段是表格与下游任务进行对齐,表格的下游任务包括表格问答、表格分类、表格数据生成、表格摘要提取等,根据不同的下游任务分别对预训练模型和下有任务的语言大模型进行联合对齐训练,从而得到能适应各种下游任务的预训练模型。
-
公开(公告)号:CN119026686A
公开(公告)日:2024-11-26
申请号:CN202410876691.5
申请日:2024-07-02
Applicant: 浙江大学
IPC: G06N5/04 , G06F16/332
Abstract: 本发明公开了人工智能技术领域的一种具像化的大模型推理辅助方法,包括以下步骤:步骤一,输入问题:以原始问题的文本描述#imgabs0#为输入,通过大语言模型对问题进行初步理解和分析;步骤二,规划阶段:识别阶段所需的关键元信息,元数据包括选择绘图工具和创建初始图像;步骤三,迭代推理阶段:根据语言模型给出的指令逐步更新图像,生成图文结合的思维链;步骤四,联合推理阶段:多模态大语言模型结合图像和文字信息,对整个思考过程进行解释和推理。本发明通过将抽象的推理问题具像化为图像,允许大语言模型接受问题的文本描述作为输入,并使用自我生成的图像作为增强推理的额外信息通道,能够减少先验知识的引入,从而提高方法的普适性。
-
公开(公告)号:CN118747810A
公开(公告)日:2024-10-08
申请号:CN202410885843.8
申请日:2024-07-03
Applicant: 浙江大学
Abstract: 本发明公开了一种图片生成方法、电子设备、介质,所述方法包括以下步骤:获取原始文本、第一概念以及与第一概念含义相反的第二概念;对原始文本、第一概念、第二概念进行编码,得到原始文本向量、第一概念向量、第二概念向量;将第一概念向量、第二概念向量相减,得到概念渲染向量;将概念渲染向量经缩放后与原始文本向量相加,得到渲染文本向量;在原始文本前拼接可学习前缀,得到目标文本;对目标文本进行编码,得到目标文本向量;通过最大化渲染文本向量与目标文本向量之间的余弦相似度,得到与渲染文本最相近的最优目标文本;将原始文本与最优目标文本分别输入至文生图模型,得到原始图片以及目标图片。
-
-
-
-
-
-
-
-
-