-
公开(公告)号:CN111291890A
公开(公告)日:2020-06-16
申请号:CN202010399728.1
申请日:2020-05-13
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供了一种博弈策略优化方法、系统及存储介质,该博弈策略优化方法包括建立基于最大熵的策略递度算法步骤和多智能体最优反应策略求解步骤。本发明的有益效果是:本发明采用中心化训练和分散式执行的方式,提高动作估值网络的准确性,同时引入了全局基线奖励来更准确地衡量智能体的动作收益,以此来解决人博弈中的信用分配问题。同时引入了最大熵方法来进行策略评估,平衡了策略优化过程中的探索与利用。
-
公开(公告)号:CN119129640A
公开(公告)日:2024-12-13
申请号:CN202411056914.X
申请日:2024-08-02
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06N3/008 , G06N3/0455 , G06N3/092
Abstract: 本发明公开了一种基于置换偏置与对比解码的智能体动作预测方法,所述方法包括:构建策略生成模型,包括Encoder模块和Decoder模块,获取局部观测向量和动作序列,将局部观测向量输入Encoder模块进行处理,得到智能体的观测表示,并将观测表示传递给Decoder模块,根据观测表示得到观测的智能体状态值函数;将动作序列输入到Decoder模块与观测表示一起进行解码,得到隐向量,将隐向量进行变换得到具有动作置换性的智能体动作集合,将具有动作置换性的智能体动作集合进行对比探索解码,得到执行动作,根据智能体状态值函数和执行动作计算总损失函数,得到目标模型,使用目标模型预测目标智能体的行为。本发明提高了对于目标智能体动作的预测精度。
-
公开(公告)号:CN118967975A
公开(公告)日:2024-11-15
申请号:CN202411065082.8
申请日:2024-08-05
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06T17/20 , G06V10/774 , G06N3/042 , G06N3/08
Abstract: 本发明涉及点云网格处理技术领域。本发明公开了一种在点云上生成多边形网格的方法、系统、设备及存储介质,其能够提高生成网格形状的灵活性和普适性。所述在点云上生成多边形网格的方法包括获取目标产品的点集,所述点集包含多个顶点;将所述点集输入网格生成算法,根据所述网格生成算法对所述点集中的每一个顶点生成对应的第一边集,并根据所有第一边集构成的第一面集生成第一待成形网格,其中,所述每个顶点对应的第一边集的长度,会根据与这个顶点相关联的其他顶点的数量而变化;基于所述第一待成形网格得到多边形网格,所述多边形网格用于呈现三维形状结构。
-
公开(公告)号:CN118966387A
公开(公告)日:2024-11-15
申请号:CN202411463649.7
申请日:2024-10-21
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06N20/00 , G06F18/10 , G06V10/82 , G06N3/0985 , G06N3/0455
Abstract: 本发明公开了一种基于多模态的对比解码幻觉减轻方法、装置及终端,方法包括:获取目标初始数据,对所述目标初始数据进行多模态扰动处理,得到目标扰动数据,所述目标初始数据包括目标高清图像及其对应的目标文本提示词;将所述目标初始数据和所述目标扰动数据输入至目标模型,得到初始输出和幻觉输出,所述目标模型为大型视觉语言模型;对所述初始输出和所述幻觉输出进行对比解码,得到目标输出。本发明通过添加多模态的噪声,并将其与初始输出进行对比,从而校准模型的预测,减少生产错误信息的可能性。
-
公开(公告)号:CN118246556B
公开(公告)日:2024-11-12
申请号:CN202410668413.0
申请日:2024-05-28
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06N5/04 , G06N3/0455 , G06N3/0499 , G06N3/092 , G06F16/35 , G06F8/41
Abstract: 本发明公开了一种基于强化学习的类型推断方法及装置,包括:获取运行环境数据和代码数据,并对所述运行环境数据和所述代码数据进行预处理,得到合法类型序列及类型流序列;根据所述合法类型序列及所述类型流序列,进行带类型标注的代码生成任务的监督训练;根据生成的带类型标注的目标代码,进行静态反馈的强化学习训练,得到强化后的代码生成模型。本发明提出了使用基于生成的方法来预测类型,并通过强化学习来增强生成模型的类型预测的准确性,解决了现有的类型推断模型的预测结果与实际应用偏差较大的问题。
-
公开(公告)号:CN117743869A
公开(公告)日:2024-03-22
申请号:CN202410179740.X
申请日:2024-02-18
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F18/22 , G06F18/213 , G06N3/0464 , G06N3/0442 , G06N3/045 , G06N3/08
Abstract: 本发明公开了一种内容发现方法、系统、终端及存储介质,其中,所述方法包括:获取目标品牌信息和目标用户内容生成信息;将视频内容信息输入到视频编码模型中得到视频特征向量,将文本内容信息输入到文本编码模型中得到文本特征向量,将目标品牌信息输入到品牌编码模型中得到品牌语义;采用预先训练完成的得分函数生成目标用户内容生成信息与目标品牌信息的相似度;获取相似度,根据预设的选取阈值从所有的目标用户内容生成信息中选取目标内容信息。本发明通过所述方法,解决了采用单模态的内容发现方法时存在着由于仅利用了图像资料而忽略了文本、话题标签等多模态信息或只利用神经网络提取图像特征而无法利用视频中语义信息的问题。
-
公开(公告)号:CN117435580A
公开(公告)日:2024-01-23
申请号:CN202311768469.5
申请日:2023-12-21
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明公开了一种数据库参数筛选方法及相关设备,所述方法包括:获取训练数据库配置参数,并进行预处理,得到数据库参数训练集;获取预设规则集,根据预设规则集构建参数性能决策树,并转化为树状神经网络预测模型;根据数据库参数训练集对树状神经网络预测模型进行训练,得到参数性能预测模型;获取当前数据库配置参数,并输入至参数性能预测模型,得到当前数据库配置参数对应的参数性能;计算当前数据库配置参数对参数性能的贡献度,并根据贡献度对当前数据库配置参数进行参数筛选。本发明通过构建参数性能预测模型来计算数据库中配置参数的贡献度,并根据贡献度对数据库中的配置参数进行筛选,大大的提升了数据库的查询效率。
-
公开(公告)号:CN117077785A
公开(公告)日:2023-11-17
申请号:CN202310711024.7
申请日:2023-06-15
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06N5/04
Abstract: 本发明属于机器博弈辅助决策优化技术领域,公开了一种机器博弈辅助决策优化方法及系统,所述机器博弈辅助决策优化系统包括:博弈数据采集模块、博弈局势判断模块、博弈数据分析模块、决策生成模块、决策优化模块、决策反馈模块。本发明通过博弈数据分析模块能够减少当前节点收益确定的分析量,提高分析效率;同时,通过决策生成模块可以将博弈对局局势的决策过程划分为多个决策阶段,并利用当前决策模型完成决策的目的,无需根据不同博弈对局局势的玩法编写复杂的规则,达到了降低决策方法的复杂度和成本,提高决策空间灵活度的技术效果,进而解决了通过大量人力编制精细的规则进行博弈对局局势决策,导致决策方法复杂度和成本就高的技术问题。
-
公开(公告)号:CN116796286A
公开(公告)日:2023-09-22
申请号:CN202310711009.2
申请日:2023-06-15
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F18/25 , G05D1/10 , G06F18/2433 , G06F18/2413 , G06T7/246 , G06V10/75 , G06N5/04 , G06N5/01 , G06N20/00
Abstract: 本发明属于无人作战机近距格斗技术领域,公开了一种基于机器博弈的六自由度无人作战机近距格斗方法及系统,所述系统包括:环境感知模块、主控模块、无线通信模块、格斗目标识别模块、格斗目标追踪模块、机器博弈决策模块、射击模块、故障预测模块、显示模块。本发明通过格斗目标追踪模块计算速度快,追踪目标的速度快;同时,通过故障预测模块充分考虑了不同六自由度无人作战机发动机的运行环境、使用寿命、出厂设置及磨损程度等方面的个体化差异,分别训练多个训练六自由度无人作战机发动机的SOM模型,以得到对应六自由度无人作战机发动机的、精确的SOM模型训练结果及相应的最小量化误差MQE;故障预测准确性高。
-
公开(公告)号:CN116127351A
公开(公告)日:2023-05-16
申请号:CN202211606757.6
申请日:2022-12-13
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) , 东莞理工学院 , 平安科技(深圳)有限公司
IPC: G06F18/24 , H04L67/01 , G06F18/214 , G06N3/098
Abstract: 本发明公开了一种面向双不均衡的联邦学习方法和系统,客户端接收服务器发送的服务器模型参数,并载入本地模型;根据当前样本类别的样本数量占当前客户端样本总数量的比值确定当前样本类别对应的权重因子;利用权重因子计算本地模型识别当前样本类别产生的损失值;利用损失值计算关于当前样本类别的参数变化量,并基于参数变化量对服务器模型参数中关于当前样本类别的模型参数进行更新,直至当前客户端内所有样本类别相关的模型参数均完成更新,得到客户端模型参数;将客户端模型参数发送至服务器,以使服务器通过引力正则项对各个客户端发送的客户端模型参数进行聚合。本发明提供的技术方案,解决了联邦学习的双重不均衡场景模型训练较差的问题。
-
-
-
-
-
-
-
-
-