-
公开(公告)号:CN118395009A
公开(公告)日:2024-07-26
申请号:CN202410556321.3
申请日:2024-05-07
Applicant: 浙江大学 , 浙江大学软件学院(宁波)管理中心(宁波软件教育中心)
IPC: G06F16/9535 , G06F18/10 , G06F18/25 , G06N3/0455 , G06N3/045 , G06N3/042 , G06V10/74 , G06F18/22 , G06N3/08 , G06N5/04
Abstract: 本发明公开了一种基于互信息与改进图自编码器的多模态推荐方法,包括:(1)构造物品‑物品共现图和物品前k相似度图,并将这两种物品图归一化;(2)通过改进的图自编码器学习有效的物品模态特征;(3)通过聚合用户所交互物品的模态表示来获得对应的用户模态特征;然后,使用L层GNN在交互图上传播和聚合用户/物品的模态特征;(4)采用两个层次的互信息约束;(5)采用内积来预测用户和物品之间的交互概率,作为推荐的依据;然后,采用多任务训练方法来训练模型;(6)利用训练好的模型进行推荐的应用。利用本发明,可有效解决多模态推荐任务中的模态噪声问题、特征冗余问题、表示对齐问题,从而大幅度提升多模态推荐系统的性能。
-
公开(公告)号:CN118331185A
公开(公告)日:2024-07-12
申请号:CN202410342665.4
申请日:2024-03-25
Applicant: 浙江大学 , 浙江大学软件学院(宁波)管理中心(宁波软件教育中心)
IPC: G05B19/418
Abstract: 本发明公开了一种基于多规则组合的动态柔性车间调度方法,该方法将调度问题分成调度规则生成和调度规则组合两个过程,首先通过遗传规划算法自动生成针对于当前工况的调度规则,并保存其中性能良好的调度规则;然后基于一种混合差分进化算法对多个良好的调度规则进行组合优化,以达成更好的调度效果。本发明在工业车间调度的场景实现了基于多调度规则的组合优化,打破了传统中的基于遗传规划生成的调度规则中只有状态量而无权重系数的局限性,相对于单一的调度规则,组合的调度规则具有更强的泛化性和更好的调度效果。
-
公开(公告)号:CN117726447A
公开(公告)日:2024-03-19
申请号:CN202311568546.2
申请日:2023-11-22
Applicant: 浙江大学软件学院(宁波)管理中心(宁波软件教育中心)
Abstract: 本发明公开了生命周期投资管理效用模型及生命周期投资管理规划方法,特点是生命周期投资管理效用模型包括收入模块、养老金模块、投资模块、公积金模块、买卖租赁房屋模块、医疗模块、预算模块和效用模块;优点是通过采集中国公开可靠大数据集、运用向量自回归等方法、全面考虑中国国情以及模拟公积金和医保机制等方式,针对中国特有的社保体系和公积金体系进行建模,能够生成更符合国情的轨迹策略,使得使用该生命周期投资管理效用模型的生命周期投资管理规划方法得出的规划结果更科学合理,为家庭投资人提供决策支持,从而大幅提高了生命周期投资管理效用模型的适用性和有效性。
-
公开(公告)号:CN116385171A
公开(公告)日:2023-07-04
申请号:CN202310255859.6
申请日:2023-03-13
Applicant: 浙江大学软件学院(宁波)管理中心(宁波软件教育中心)
Abstract: 本发明公开了一种基于深度强化学习的生命周期投资管理规划方法,特点是构建HPPO模型;获取用户输入的参数;初始化HPPO模型中的环境、智能体和多层感知机;对初始化后的HPPO模型进行训练,得到训练后的HPPO模型;运行训练后的HPPO模型并输出所有轨迹策略;如果用户满意当前输出的所有轨迹策略,则用户接收当前输出的所有轨迹策略;如果用户不满意当前输出的所有轨迹策略,则用户修改输入的参数;优点是采用多层感知机和概率采样处理连续空间的决策问题,避免连续空间离散化带来的解空间减少的问题,并且可以通过修改用户输入的参数来初始化HPPO模型,能适应真实问题的变化,增强了泛化性。
-
公开(公告)号:CN119377365A
公开(公告)日:2025-01-28
申请号:CN202411468509.9
申请日:2024-10-21
Applicant: 浙江大学 , 浙江大学软件学院(宁波)管理中心(宁波软件教育中心)
IPC: G06F16/3329 , G06F16/334 , G06F16/36 , G06N5/04
Abstract: 本发明公开了,本发明提出了一种基于历史人物作品与生平的大模型构建方法及装置,专门用于扮演历史人物的大模型构建。通过这一方法,模型不仅能够生成符合苏轼风格的文本,还能在多轮对话中动态展现苏轼的思想深度和个性特征,对于超出历史人物的知识,模型也能还原出历史人物的无知与迷惑。本发明利用历史人物的文学作品和生平事迹,构建了具有文化深度的苏轼对话数据集,对大语言模型进行微调,并通过构建历史人物作品和生平的知识库,突破了现有技术在语言生成和知识推理方面的局限性,成功实现了对苏轼这一历史人物的言行举止、思想观点和文学风格的高度逼真模拟。
-
公开(公告)号:CN119359832A
公开(公告)日:2025-01-24
申请号:CN202411293490.9
申请日:2024-09-14
Applicant: 浙江大学 , 浙江大学软件学院(宁波)管理中心(宁波软件教育中心)
IPC: G06T11/00 , G06T5/90 , G06T5/60 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种噪声空间反演的人物图像编辑方法及装置。本发明使用了扩散模型对人物图像进行反演,实现了对人物图像的精准重构,解决编辑过程中人物出现伪影的问题;提取人物图像面部轮廓特征,使用控制网络对轮廓特征进行卷积处理后注入扩散模型,保证了编辑过程中人物的一致性,解决编辑导致的前后人物不一致的问题;使用文本提示对人物图像进行编辑,文本提示通过扩散模型中的交叉注意力层对特征图像进行编辑,解决用户编辑方式单一且困难的问题。
-
公开(公告)号:CN118864103A
公开(公告)日:2024-10-29
申请号:CN202410868175.8
申请日:2024-07-01
Applicant: 浙江大学软件学院(宁波)管理中心(宁波软件教育中心)
Abstract: 本发明公开了生命周期投资管理效用模型及生命周期投资管理规划方法,特点是生命周期投资管理效用模型包括收入模块、养老金模块、投资模块、公积金模块、买卖租赁房屋模块、医疗模块、预算模块和效用模块;优点是通过采集中国公开可靠大数据集、运用向量自回归等方法、全面考虑中国国情以及模拟公积金和医保机制等方式,针对中国特有的社保体系和公积金体系进行建模,能够生成更符合国情的轨迹策略,使得使用该生命周期投资管理效用模型的生命周期投资管理规划方法得出的规划结果更科学合理,为家庭投资人提供决策支持,从而大幅提高了生命周期投资管理效用模型的适用性和有效性。
-
公开(公告)号:CN119946353A
公开(公告)日:2025-05-06
申请号:CN202411901236.2
申请日:2024-12-23
Applicant: 浙江大学软件学院(宁波)管理中心(宁波软件教育中心)
Abstract: 本发明公开了一种反电信欺诈的虚假人脸视频多模态帧级检测方法,特点是检测方法主要包括数据预处理、构建待训练的音视频神经网络检测模型、对检测模型的训练和对目标视频的检测识别的步骤;优点是同时利用了视频的视觉特征和音频特征,通过构建多模态神经网络,将视觉信息和音频信息进行深度融合。传统的伪造视频检测方法往往仅依赖于视觉特征,而本发明结合了音频信号,使得检测更加全面;通过对音视频特征的联合分析,本发明能够有效提高伪造视频片段检测的准确性,尤其是在伪造音视频同步欺诈场景中具有显著优势。
-
公开(公告)号:CN118552097A
公开(公告)日:2024-08-27
申请号:CN202410505795.5
申请日:2024-04-25
Applicant: 浙江大学 , 浙江大学软件学院(宁波)管理中心(宁波软件教育中心)
IPC: G06Q10/08 , G06N3/092 , G06N3/084 , G06N3/042 , G06Q10/047
Abstract: 本发明公开了一种基于深度强化学习的仓储物流调度方法,包括调度数据集构建、深度神经网络模型构建和训练以及运输路径生成。深度神经网络包括指针网络和图神经网络,分别用与输出运输点概率向量和热图向量,且根据运输点概率向量与二维坐标距离长度构建第一奖惩值、根据热图向量与目标二维热图向量的交叉熵构建第二奖惩值;将两个奖惩值应用到损失函数中进行反向传播。所述运输路径生成利用旅行商问题的局部最优性,通过交换运输点位置,有效解决最优运输路径中相邻运输点在现有神经网络方法得到的运输路径中可能相隔很远的问题。
-
公开(公告)号:CN119251365A
公开(公告)日:2025-01-03
申请号:CN202411239784.3
申请日:2024-09-05
Applicant: 浙江大学 , 浙江大学软件学院(宁波)管理中心(宁波软件教育中心)
Abstract: 本发明公开了一种面向多要素驱动源的2D数字人生成方法及装置,包括获取文本、语音和视频多种要素的驱动源以及待驱动的虚拟形象图像,并使用驱动源解析模块中的文本转语音、音频特征提取和视频预处理等算法得到唇形驱动源和动作驱动源;将动作驱动源中的姿势动作和表情动作迁移到待驱动的虚拟图像中,得到与动作驱动源动作同步的驱动结果;并根据唇形驱动源将动作驱动结果中的口型替换为新口型,得到与唇形驱动源同步的结果;将文本和语音信号对应的融合音频与动作及唇形的双重驱动结果进行合成,得到音画匹配的2D数字人生成结果。本发明支持多要素的驱动源进行较为可控的2D数字人驱动生成。
-
-
-
-
-
-
-
-
-