一种基于人设背景大语言模型的角色扮演聊天机器人实现方法

    公开(公告)号:CN119646140A

    公开(公告)日:2025-03-18

    申请号:CN202411673706.4

    申请日:2024-11-21

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于人设背景大语言模型的角色扮演聊天机器人实现方法,包括:收集大量文学作品的文本数据,利用大模型提取角色对话、动作及摘要,同时提取角色设定信息;从角色对话中提取双人多轮对话,与角色设定匹配,形成初步数据集;将初步数据集转换为Json格式,构建结构化的多轮对话数据集;采用LoRA方法和DPO方法对大语言模型进行微调;基于微调后的大语言模型构建聊天机器人,整合角色信息、背景故事、历史对话摘要及少量示例对话,形成动态提示词框架;为聊天机器人构建智能聊天框架,包括时间计划模块、主动推送模块和延迟聊天模块。利用本发明,可有效提升对话质量、角色个性化、角色一致性、交互连贯性及用户体验。

    一种在分布式流计算引擎Apache Flink中实时均衡负载的方法

    公开(公告)号:CN119440718A

    公开(公告)日:2025-02-14

    申请号:CN202411415621.6

    申请日:2024-10-11

    Applicant: 浙江大学

    Abstract: 本发明公开了一种在分布式流计算引擎Apache Flink中实时均衡负载的方法,包括在Flink内核中新增可以进行子任务重新分配的重启功能及其接口;为Flink增加根据节点数评估子任务计算量并综合考虑计算节点计算能力的子任务分配策略;在新增计算节点时自动将正在执行中的流任务的工作负载均衡到新增计算节点上;在遇到突发流量时自动均衡计算节点集群的工作负载。本发明依靠高效的重启功能、更加均衡的子任务分配策略、更实时且自动的均衡负载手段,使本发明方法在保证用户无感知的前提下,能更快、更好的实现分布式Flink系统的负载均衡,提升流计算引擎整体的任务执行效率和资源利用率。

    一种针对异构数据库混合检索生成增强的知识问答方法及系统

    公开(公告)号:CN119311831A

    公开(公告)日:2025-01-14

    申请号:CN202411429216.X

    申请日:2024-10-14

    Applicant: 浙江大学

    Abstract: 本发明公开了一种针对异构数据库混合检索生成增强的知识问答方法及系统,其中,方法包括以下步骤:(1)处理文本数据,构建异构数据库;(2)接收用户查询,在异构数据库中进行混合检索;合并检索结果,得到与用户查询相关的文档和三元组信息;(3)使用重排序模型对检索到的文档和三元组信息进行重新排序,选出与用户查询相关度最高的K个检索结果;(4)将用户查询与检索结果组合,构建提示词并输入到大语言模型中,生成连贯且准确的自然语言答案。利用本发明,可以实现更加全面、准确的信息检索,提升知识问答结果的准确性和可靠性。

    一种基于深度强化学习的大规模旅行商问题求解方法

    公开(公告)号:CN119047671A

    公开(公告)日:2024-11-29

    申请号:CN202411011372.4

    申请日:2024-07-26

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于深度强化学习的大规模旅行商问题求解方法,包括:(1)将大规模旅行商问题建模为马尔科夫决策过程;(2)随机生成一系列大规模旅行商问题实例并进行数据增强,得到训练数据;(3)构建基于端到端深度强化学习的大规模旅行商问题求解模型架构,该模型包括编码器和解码器,编码器采用快速注意力机制作为注意力层,解码器使用一个特殊的上下文节点来表示当前的解码状态;(4)设计决策网络,训练模型;决策网络选择REINFORCE,利用深度强化学习方法中的对称性对REINFORCE算法进行改进;(5)利用训练好的模型进行旅行商问题求解,并对求解结果进行优化。本发明可以解决大规模旅行商问题求解中时间效率和内存占用的双重挑战。

    一种基于检索的文生视频方法
    95.
    发明公开

    公开(公告)号:CN119011969A

    公开(公告)日:2024-11-22

    申请号:CN202411054722.5

    申请日:2024-08-02

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于检索的文生视频方法,包括:(1)对输入的文本提示P进行文本特征提取,获得语义向量;(2)利用语义向量在文本‑视频库中进行检索,匹配相似的文本‑视频对,选择与输入的文本提示P最相似的参考视频;(3)从参考视频中提取关键帧及其关键区域,并进行运动特征的提取;(4)使用提取的运动特征对预训练的文本‑视频生成模型进行微调;(5)将文本提示P输入到微调后的文本‑视频生成模型中,生成最终视频。利用本发明,可以提高生成视频的运动特征精准度,降低计算成本的同时提升视频的真实性。

    一种面向图像识别域适应的无监督评估方法

    公开(公告)号:CN116883744A

    公开(公告)日:2023-10-13

    申请号:CN202310857344.3

    申请日:2023-07-13

    Applicant: 浙江大学

    Inventor: 陈铭浩 蔡登

    Abstract: 本发明公开了一种面向图像识别域适应的无监督评估方法,包括:(1)使用源域和目标域的训练集学习得到若干分类模型;(2)使用源域经过分类模型M得到模型预测,并与源域验证集标签对比,得到源域的准确率AS;(3)源域数据经过分类模型M时保留中间特征,并使用中间特征和对应标签训练分类器h;(4)目标域的验证集进行数据增强,增强前后数据都经过分类模型M得到对应中间特征,再经过分类器h得到对应的预测,得到增强一致性AC;(5)将AS和AC结合,并加入分类器h的多样性项,得到估指标ACM,评估分类模型M的迁移效果。本发明能够无监督地评估模型的迁移效果,从而选择出图像识别效果最好的超参数和模型,从而提高图像分类的效果。

    一种基于文本驱动的高效弱监督语义分割方法及装置

    公开(公告)号:CN115937852A

    公开(公告)日:2023-04-07

    申请号:CN202211597202.X

    申请日:2022-12-12

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于文本驱动的高效弱监督语义分割方法及装置,包括如下步骤:(1)将图片和对应的类别名输入预训练好的视觉‑语言模型,使用基于梯度的类激活映射得到初始的类激活图;(2)基于视觉transformer中的多头自注意力机制对初始的类激活图进行改进;(3)使用条件随机场对改进后的类激活图进行后处理,得到语义分割的伪标签;(4)利用生成的伪标签训练语义分割模型,并利用训练好的语义分割模型对待分割的图片进行语义分割。本发明通过引入基于视觉transformer架构的视觉‑语言模型来高效地为语义分割生成高质量的伪标签,从而提高语义分割模型的分割效率和效果。

    一种基于对偶记忆模块的视频异常检测方法及系统

    公开(公告)号:CN112633180B

    公开(公告)日:2022-05-24

    申请号:CN202011561521.6

    申请日:2020-12-25

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于对偶记忆模块的视频异常检测方法及系统,其中,方法的步骤如下:(1)使用连续帧作为输入,利用卷积神经网络提取特征,获得问询向量;(2)使用正常/异常询向量和记忆向量作为输入,利用对偶记忆模块“读操作”,生成新的正常/异常特征;(3)利用判别器生成判别特征,利用生成器生成未来帧;(4)利用未来帧的预测损失和对偶记忆模块的稀疏程度计算异常得分。利用本发明,可以有效的解决视频异常检测中正负样本量极其不均衡的问题,并且能够生成具有判别性的特征空间。

    一种基于连词标记和强化学习的自然语言推理方法

    公开(公告)号:CN108717574B

    公开(公告)日:2021-09-21

    申请号:CN201810252473.9

    申请日:2018-03-26

    Applicant: 浙江大学

    Abstract: 本发明提供了一种基于连词标记和强化学习的自然语言推理方法,包括以下步骤:(1)在连词预测任务上训练一个连词预测模型;(2)在自然语言推理模型中,输入前提和猜想文本并使用编码器对其编码,得到表达矩阵;(3)将连词预测模型的编码器嵌入到自然语言推理模型中,将步骤(2)编码过程中得到的前提和猜想的词向量送入预训练好的编码器并输出表达向量;(4)将自然语言推理模型的编码器和嵌入的连词预测模型中的编码器在注意力机制中交互,得到一个注意力向量;(5)将注意力向量转化为概率分布并输出结果。利用本发明,通过迁移其他监督学习任务所学到的知识,大大提升了在大规模数据集上进行自然语言推理任务的准确率。

    一种基于自编码网络的换衣行人重识别方法及系统

    公开(公告)号:CN110321801B

    公开(公告)日:2021-08-03

    申请号:CN201910496351.9

    申请日:2019-06-10

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于自编码网络的换衣行人重识别方法及系统,其中,方法包括:(1)对行人图片中行人的衣服部分生成掩膜;(2)利用衣服特征编码器EA获取衣服特征表示向量;(3)根据掩膜去掉行人图片中的衣服部分,利用换衣图片生成器G生成换衣图片;(4)构建衣服无关特征学习网络,包含特征提取器F以及图片生成器R;(5)将真实行人图片以及生成的换衣图片两两配对,对特征提取器F进行训练;(6)训练收敛后,输入真实、有标记的行人图片,使用交叉熵损失函数对特征提取器F进行微调;(7)利用最终得到的特征提取器F进行行人重识别的应用。利用本发明,使得在行人外貌变化丰富的场景下,能够学习得到鲁棒的判别性特征。

Patent Agency Ranking