-
公开(公告)号:CN114676846A
公开(公告)日:2022-06-28
申请号:CN202210233742.3
申请日:2022-03-10
Applicant: 清华大学
Abstract: 本发明提供一种多智能体强化学习方法及系统,其中的方法包括:获取多智能体的共享经验数据集;根据共享经验数据集,对初始策略进行训练,得到共享策略;获取多智能体当前的目标状态;将目标状态输入至共享策略,获取目标决策动作,该方法使得多智能体可以根据自身需要随时调用共享策略,不需要多智能体中每一个智能体单独维护一个策略模块,从而避免了存储空间和计算资源的浪费,并保持了多智能体策略的一致性。
-
公开(公告)号:CN114676757A
公开(公告)日:2022-06-28
申请号:CN202210225870.3
申请日:2022-03-09
Applicant: 清华大学
IPC: G06K9/62 , A63F13/822
Abstract: 本发明涉及一种多人非完备信息博弈游戏策略生成方法和装置,包括:获取玩家决策前的博弈状态信息;基于共享策略网络和博弈状态信息确定最优决策动作,以便玩家参考最优决策动作制定目标定决策动作;其中,共享策略网络,是预先利用共享数据集中的博弈样本训练的强化学习网络。本发明共享策略网络是一种强化学习网络结构,主要采用离线方式进行学习,将大量用于学习的计算量放在训练阶段,从而在使用阶段只需要以博弈状态信息为切入点调用训练好的策略网络即可实时决策,避免了其他博弈策略搜索算法搜索过程中计算量大以及耗时长的问题。
-
公开(公告)号:CN113449595A
公开(公告)日:2021-09-28
申请号:CN202110578930.5
申请日:2021-05-26
Applicant: 清华大学
Abstract: 本发明提供一种物品身份信息匹配方法、装置、电子设备及存储介质,包括:获取第一样本图像的第一相对坐标集,和物品图像的第二相对坐标集,其中,所述第一样本图像是第一图像样本集中的图像,所述第一图像样本集是根据物品图像的特征描述子和预设图像样本集中每个样本图像的特征描述子得到的;确定所述第一相对坐标集中,处于预设阈值扇内第一数量的第一特征点,其中,所述预设阈值扇是基于所述第二相对坐标集确定的;在所述第一数量大于第一预设阈值情况下,根据所述第一样本图像的身份信息确定所述物品图像的身份信息。通过本发明的方法,可以明显降低利用物品指纹识别物品身份的误识率,提高物品身份信息匹配结果的准确率。
-
公开(公告)号:CN113436201A
公开(公告)日:2021-09-24
申请号:CN202110580614.1
申请日:2021-05-26
Applicant: 清华大学
Abstract: 本发明提供一种物品指纹区域选取方法及装置,该方法包括:获取候选指纹区域的孤立区域关联状态,边缘明显程度和特征点数量;根据候选指纹区域的孤立区域关联状态,边缘明显程度和特征点数量,确定候选指纹区域是否作为目标指纹区域。该方法根据候选指纹区域的孤立区域关联状态,边缘明显程度和特征点数量,确定候选指纹区域是否作为目标指纹区域,能够避免人工选取物品指纹区域所带来的同类别物品指纹区域不统一的问题,避免人工选取物品指纹区域图像特征不够明显导致的物品身份鉴别精确度差的问题,以及能够避免因为使用不同分辨率和放大倍数的相机拍摄指纹区域面积不统一导致的指纹区域定位错误。
-
公开(公告)号:CN111028211B
公开(公告)日:2020-10-27
申请号:CN201911181591.6
申请日:2019-11-27
Applicant: 清华大学
Abstract: 本发明实施例提供一种陶瓷产品识别方法及系统,该方法包括:根据待识别陶瓷的图像,获取待识别陶瓷的指纹特征;将待识别陶瓷的指纹特征中每一指纹子向量与目标陶瓷的指纹特征中每一指纹子向量进行预匹配,获取匹配成功个数;若第一比值和第二比值之间的差值在预设范围之内,则待识别陶瓷和目标陶瓷为同一产品。本发明实施例提供一种陶瓷产品识别方法,通过比对待识别陶瓷的指纹特征和目标陶瓷的指纹特征,以对待识别陶瓷与目标陶瓷是否为同一产品进行判定,与现有技术相比,可以省去防伪标识号的分配与防伪标志的制造,节约了成本。
-
公开(公告)号:CN108009263A
公开(公告)日:2018-05-08
申请号:CN201711328506.5
申请日:2017-12-13
Applicant: 清华大学
IPC: G06F17/30
CPC classification number: G06F16/951
Abstract: 本发明公开一种基于供需信息的区块链网络搜索方法及系统,所述区块链网络搜索方法包括:获取用户的搜索需求信息;对所述用户的搜索需求信息进行识别,确定用户的搜索需求内容;根据所述搜索需求内容,遍历门户区块链网络中的全息化门户系统,获得对应的搜索结果;所述门户区块链网络包括由若干全息化门户系统区块链通过同一个或多个门户系统相关联形成的网络,每个全息化门户系统区块链包括若干具有商务、政务和社交关系的门户系统,且每个全息化门户系统区块链能够提供供应信息和/或需求信息。在搜索过程中,通过逐一搜索全息化门户系统,可减小搜索范围,从而大大降低资源消耗,提高搜索效率以及搜索的精准度。
-
公开(公告)号:CN107844991A
公开(公告)日:2018-03-27
申请号:CN201711048321.9
申请日:2017-10-31
Applicant: 清华大学
IPC: G06Q30/02
CPC classification number: G06Q30/0239 , G06Q30/0213 , G06Q30/0234
Abstract: 本发明公开了一种基于网络支付可得性计算的在线支付推广方法及系统,通过对网络支付可得性进行定量评价与计算,用于指导在线支付推广策略。本发明的在线支付推广方法,能够定量评价网络支付的可得性,且计算量小,计算效率高,能够全面、客观地评价一个地区的网络支付基础设施建设或应用水平。此外,本发明还基于计算的网络支付可得性指导在线支付推广,能够更好地指导在线支付推广策略,具有数据来源可行、编制过程简单、评价结果客观、可信的特点,以合理地调整在线支付推广策略。
-
公开(公告)号:CN107832934A
公开(公告)日:2018-03-23
申请号:CN201711051051.7
申请日:2017-10-31
Applicant: 清华大学
CPC classification number: G06Q10/0631 , G06Q10/0639 , G06Q10/08
Abstract: 本发明公开了一种基于物流可达性计算的物流资源分配方法及系统,通过物流可达性的计算,指导物流资源分配与评估各方面物流基础设施建设优先级,以达到物流资源合理分配。通过本发明的物流可达性计算,能够定量评价物流可达性,且计算量小,计算效率高,能够全面、客观地评价一个地区的物流基础设施建设水平;此外,本发明还基于计算的物流可达性指导物流资源的分配,能够更好地指导物流资源分配,具有数据来源可行、编制过程简单、评价结果客观、可信的特点。
-
公开(公告)号:CN107819792A
公开(公告)日:2018-03-20
申请号:CN201711327624.4
申请日:2017-12-13
Applicant: 清华大学
Abstract: 本发明公开一种区块链网络和行为有效性验证方法及系统。该方法包括:获取所述区块链中与所述行为相关的用户终端广播的所述行为的信息;所述行为具体为入链行为、出链行为或交易行为;生成时间块,将所述行为的信息记录到所述时间块中;利用共识机制对所述行为的信息进行验证,得到验证结果;所述共识机制为区块链中的所有用户终端共同对所述行为的信息进行验证的机制;当所述验证结果表示行为有效时,将所述行为记录为有效行为;当所述验证结果表示行为无效时,将所述行为记录为无效行为。本发明公开的方案提高了用户信息的安全性,保证了区块链中行为的安全性。
-
公开(公告)号:CN107800573A
公开(公告)日:2018-03-13
申请号:CN201711051036.2
申请日:2017-10-31
Applicant: 清华大学
IPC: H04L12/24
CPC classification number: H04L41/0896 , H04L41/0823 , H04L41/5009 , H04L41/5029
Abstract: 本发明公开了一种基于网络可达性计算的宽带推广方法及系统,通过对网络可达进行定量评价与计算,用于指导宽带推广策略。本发明的宽带推广方法,能够定量评价网络可达性,且计算量小,计算效率高,能够全面、客观地评价一个地区的网络基础设施水平。此外,本发明还基于计算的网络可达性指导宽带推广,能够更好地指导宽带推广策略,具有数据来源可行、编制过程简单、评价结果客观、可信的特点,以合理地调整宽带推广策略。
-
-
-
-
-
-
-
-
-