-
公开(公告)号:CN114048833A
公开(公告)日:2022-02-15
申请号:CN202111303688.7
申请日:2021-11-05
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明公开了一种基于神经网络虚拟自我对局的多人、大规模非完全信息博弈方法及装置,本发明在传统的神经网络虚拟自我对局NFSP算法的基础上引入了优先级经验采样机制和优先级加权的程度控制机制,根据经验片段的学习价值设置优先级来过滤记忆库中的经验,对于优先经验的存储和采样,采用求和树的数据结构,以时间复杂度实现优先级经验采样,降低NFSP训练过程中与环境交互的代价,加快求解速度;同时使用马尔科夫决策过程对扩展式博弈进行建模,将多人博弈转化成单个智能体与环境的交互过程,可看作单个智能体和环境的二人博弈,将NFSP的应用范围拓展至多人博弈,增强算法的泛用性。
-
公开(公告)号:CN113965359A
公开(公告)日:2022-01-21
申请号:CN202111152694.7
申请日:2021-09-29
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明公开了一种面向联邦学习数据投毒攻击的防御方法及装置,方法包括:每个客户端使用本地数据训练模型参数;每个客户端将本地模型参数上传给服务器,服务器接收到所有的模型参数;服务器从中计算出一个用于比较的参考基准u,则对于任意的两个局部模型wa和wb,计算它们相对于参考基准u的相似度;采用内部投票的方法判断一个局部模型是否为恶意;根据每个局部模型所得的票数,计算每个局部模型的可信度;基于可信度的模型加权聚合,得到最终的全局模型,基于最终的全局模型实现数据投毒攻击的防御。本发明中,恶意客户端的模型会被赋予较低权重,在加权聚合时削弱它对全局模型的影响,从而实现针对数据投毒攻击的防御。
-
公开(公告)号:CN113487351A
公开(公告)日:2021-10-08
申请号:CN202110755722.8
申请日:2021-07-05
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明公开了一种隐私保护广告点击率预测方法、装置、服务器及存储介质,所述方法包括:将全局模型下发至各个客户端,以使各个客户端训练本地模型,分别通过计算因子分解机组件和深度学习组件的梯度获得权重更新向量;计算各个客户端之间的相似度;采用聚类联邦学习算法,对所有客户端进行聚类,使每个聚类生成一个全局模型;在每个聚类中,将全局模型下发给该聚类中的所有客户端,以使该聚类中的所有客户端更新本地模型,直至全局模型收敛或达到最大轮次;接收某个用户的客户端发送的请求,在相应聚类中将全局模型下发给该用户的客户端,以计算该用户的候选广告的广告点击率。本发明保持联邦学习模型可用性的同时保护客户端数据的隐私安全。
-
公开(公告)号:CN113420787A
公开(公告)日:2021-09-21
申请号:CN202110599827.9
申请日:2021-05-31
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明公开了一种缓解多任务学习中任务冲突的方法、装置及存储介质,所述方法获取待缓解多任务学习模型中各个学习任务的梯度值;判断各学习任务中选定学习任务与其余各学习任务之间是否存在任务冲突,在判定存在任务冲突时对选定学习任务的梯度值进行修剪,并将选定学习任务的梯度值更新为修剪后的梯度值,在选定学习任务的梯度值更新执行完毕后重新选定一学习任务作为选定学习任务重复执行梯度值更新,直至模型中所有学习任务的梯度值更新完毕,计算所有学习任务完成梯度值更新后的梯度值的平均值,获得平均梯度值,根据平均梯度值对模型的网络参数进行更新。通过实施本发明能在实现缓解任务冲突同时保持各个任务训练均衡。
-
公开(公告)号:CN112163222A
公开(公告)日:2021-01-01
申请号:CN202011077442.8
申请日:2020-10-10
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本申请公开了一种恶意软件检测方法,该方法包括以下步骤:确定待检测的目标软件;获得目标软件的系统调用名和网络活动事件;将目标软件的系统调用名和网络活动事件按照时间戳统一排序,编码生成目标软件的聚合动态特征;将目标软件的聚合动态特征输入到预先训练获得的基于序列转换器结构的目标神经网络模型中,获得输出结果;根据输出结果,确定目标软件是否为恶意软件。应用本申请所提供的技术方案,结合了软件的系统调用名和网络活动事件,利用序列转换器结构,对终端中恶意软件进行有效检测,避免影响终端的正常运行,提高用户使用体验。本申请还公开了一种恶意软件检测装置,具有相应技术效果。
-
公开(公告)号:CN112084341A
公开(公告)日:2020-12-15
申请号:CN202010867403.1
申请日:2020-08-26
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F16/36 , G06F40/295
Abstract: 本发明提出一种基于三元组重要性的知识图谱补全方法,包括一:估计知识图谱中三元组的头实体的重要性和尾实体的重要性;二:估计三元组中关系的一阶重要性和高阶重要性;三:根据三元组中头实体的重要性、尾实体的重要性和关系的重要性获得三元组的重要性。本发明对知识图谱中的三元组重要性进行了较充分的挖掘,既考虑了实体重要性,也考虑了关系重要性,进一步提升知识图谱补全效果。
-
公开(公告)号:CN107145792B
公开(公告)日:2020-09-15
申请号:CN201710225047.1
申请日:2017-04-07
Applicant: 哈尔滨工业大学深圳研究生院
Abstract: 本发明提供一种基于密文数据的多用户隐私保护数据聚类方法及系统,属于数据挖掘技术领域。本发明方法包括步骤:两个以上用户发送各自加密后的数据和聚类中心点、陷门信息给服务器;服务器计算密文数据点和聚类中心点的距离,并划分聚类;服务器将每个聚类中不同的用户的数据点分别进行相加,并将数据的总和及个数分别发送给用户;用户将收到的数据总和及个数重新加密后发送给服务器;服务器计算新的聚类中心点,并将新的聚类中心点发送给各个用户;各个用户通过外包隐私保护平均数计算协议共同计算每个聚类中数据点距离聚类中心点的平均值,然后发送给服务器,进行下次迭代。本发明大大提高了聚类效率;实现半诚实模型下的安全计算,同时可以抵抗一定程度上的合谋攻击。
-
公开(公告)号:CN110404265A
公开(公告)日:2019-11-05
申请号:CN201910676451.X
申请日:2019-07-25
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明提供了一种基于博弈残局在线解算的多人非完备信息机器博弈方法、装置、系统及存储介质,该多人非完备信息机器博弈方法包括:步骤1:首先根据卡牌抽象算法进行实时的卡牌抽象;步骤2:如果S不是智能体采取动作的博弈局面,则需要更新各个玩家的策略σ;步骤3:等待当前博弈局面需要采取动作的玩家采取某一动作后,游戏往下进行,如果S是轮到智能体采取动作的博弈局面则同样先更新玩家手牌分布,建立子博弈树后计算当前博弈局面的策略σ,然后智能体根据σ采取一个动作a后游戏继续向下进行。本发明的有益效果是:本发明相比之前的算法灵活性适用性更强,适用于现实世界的博弈场景,可以根据针对不同的现实博弈局面计算相应的策略。
-
公开(公告)号:CN110399920A
公开(公告)日:2019-11-01
申请号:CN201910676439.9
申请日:2019-07-25
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明提供了一种基于深度强化学习的非完备信息博弈方法、装置、系统及存储介质,该方法包括:探索利用机制改进策略梯度算法的步骤、深度强化学习网络中加入记忆单元的步骤、自我驱动机制对奖励值进行优化的步骤。本发明的有益效果是:本发明通过基线函数解决策略梯度算法经常出现的高方差问题,对于强化学习采样和优化过程时间复杂度高的问题,采取并行机制提高模型求解效率,通过自驱动机制,在弥补环境奖励值稀疏的同时,帮助智能体更有效地对环境进行探索。
-
公开(公告)号:CN109815303A
公开(公告)日:2019-05-28
申请号:CN201811654923.3
申请日:2018-12-29
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F16/29
Abstract: 本申请涉及一种基于位置的移动数据存储系统及其优化方法,在预设的负载和存储预算的情况下,根据查询范围及存储系统中的原始数据,生成用于查询的多个候选副本,并使用查询成本评估模块对上述多个副本构成的副本集合进行评估,并从中选择出一个成本最低或接近最低的副本集合。用以实现对基于位置的移动数据大数据分布式存储系统的宽查询范围性能的优化,并在此基础上提出了贪婪算法及线性规划舍入算法进一步对存储系统的性能进行进一步的发掘。
-
-
-
-
-
-
-
-
-