一种基于鲁棒模仿学习的模拟器建模方法

    公开(公告)号:CN113239634A

    公开(公告)日:2021-08-10

    申请号:CN202110654854.1

    申请日:2021-06-11

    Abstract: 本发明公开了一种基于鲁棒模仿学习的模拟器建模方法,涉及强化学习领域,包括以下步骤:从策略分布中采样出训练策略集合Π和测试策略集合Π′;令训练策略集合Π的策略π与真实环境p*进行交互,以获得真实数据集合Bπ={(s,a,s′)~(πp*);每k步进行一次策略筛选;令策略π与学习到的模拟器进行交互,并计算价值差异VD,以衡量模拟器在策略π下的表现;选取其中表现最差的∈%策略构成集合Πc,其对应的数据集记为Bc;从Bc中采样数据,并利用Πc中的策略与当前模拟器交互以收集数据Dp,用以优化生成对抗模仿学习中的判别器Dω,以及用以优化生成对抗模仿学习中的生成器重复上述步骤直到重复次数达到事先设定的阈值。该方法使得学到的模型具有更强的鲁棒性。

    大规模数据信息排重处理系统

    公开(公告)号:CN101414309A

    公开(公告)日:2009-04-22

    申请号:CN200810203439.9

    申请日:2008-11-27

    Abstract: 本发明涉及的是一种信息处理技术领域的大规模数据信息排重处理系统,包括输入模块、数字编码模块、多点检验模块、输出模块,输入模块接收需要进行排重的原始数据,即数据实例;数字编码模块将输入模块获得的数据实例进行重新编码,将数据空间压缩到与待解问题实际数据实例的规模相当或稍大的空间;多点检验模块对新编码进行多次采样,并与高速存储的地址建立映射关系,通过控制高速存储相应地址的标志位来记录是否已经出现过某一个数据实例,从而实现排重功能;输出模块将经过排重的数据返回给用户。本发明具有高效性及可处理数据量大等特点。

    结构化对等网络系统及其负载查询、转移及资源查找方法

    公开(公告)号:CN1937557A

    公开(公告)日:2007-03-28

    申请号:CN200610122064.4

    申请日:2006-09-05

    Abstract: 本发明提供一种可保证负载均衡的结构化对等网络系统及其负载查询、转移及资源查找方法,所述节点设备主要包括存储单元、负载转移处理单元以及资源查找单元。本发明通过在结构化对等网络系统的各个节点设备存储该对等网络系统负载信息,当某个节点设备的负载过高时,根据所述对等网络系统负载信息选择一个负载较轻的节点设备,并将该过高的负载转移到所述负载较轻的节点设备,从而可保证系统保持负载均衡。本发明与结构化对等网络系统中采用何种哈希算法没有关系,只要系统中存在负载分配不均,就可以应用本发明实现负载均衡。

    训练方法、推荐方法及相关产品
    14.
    发明公开

    公开(公告)号:CN119740020A

    公开(公告)日:2025-04-01

    申请号:CN202411440211.7

    申请日:2024-10-15

    Abstract: 本申请涉及深度学习技术领域,尤其公开了一种训练方法、推荐方法及相关产品,该训练方法包括:获取目标对象的初始对象表征和目标物品的初始物品表征;基于目标对象与目标物品的交互关系,以及不同目标物品之间的物品多模态相似关系,更新初始物品表征,得到第一更新物品表征,物品多模态相似关系包括基于目标物品在至少一种预定模态下的表征确定的相似关系;基于交互关系,以及不同目标对象之间的对象多模态相似关系,更新初始对象表征,得到第一更新对象表征,对象多模态相似关系包括基于目标对象在至少一种预定模态下的表征确定的相似关系;基于第一更新物品表征、第一更新对象表征以及物品多模态表征,训练目标模型。

    一种基于鲁棒模仿学习的模拟器建模方法

    公开(公告)号:CN113239634B

    公开(公告)日:2022-11-04

    申请号:CN202110654854.1

    申请日:2021-06-11

    Abstract: 本发明公开了一种基于鲁棒模仿学习的模拟器建模方法,涉及强化学习领域,包括以下步骤:从策略分布中采样出训练策略集合Π和测试策略集合Π′;令训练策略集合Π的策略π与真实环境p*进行交互,以获得真实数据集合Bπ={(s,a,s′)~(πp*);每k步进行一次策略筛选;令策略π与学习到的模拟器进行交互,并计算价值差异VD,以衡量模拟器在策略π下的表现;选取其中表现最差的∈%策略构成集合Πc,其对应的数据集记为Bc;从Bc中采样数据,并利用Πc中的策略与当前模拟器交互以收集数据Dp,用以优化生成对抗模仿学习中的判别器Dω,以及用以优化生成对抗模仿学习中的生成器重复上述步骤直到重复次数达到事先设定的阈值。该方法使得学到的模型具有更强的鲁棒性。

    提供下载推荐服务的方法、结构化对等网络和其中的节点

    公开(公告)号:CN101399738B

    公开(公告)日:2011-04-20

    申请号:CN200710151589.5

    申请日:2007-09-28

    Abstract: 本发明实施例公开了一种基于结构化对等网络的提供下载推荐服务方法和下载方法。利用位置敏感哈希函数,将对等网络中符合预定条件的每一个节点的下载记录哈希保存到对等网络中相应的节点上;对于当前节点,利用所述位置敏感哈希函数对该当前节点的下载记录进行哈希处理得到键值,根据负责索引所得键值中的至少一个键值的各个节点所保存的索引日志,获得当前节点的下载推荐列表;当前节点根据下载推荐列表进行下载。本发明实施例还公开了一种结构化的对等网络和三种结构化的对等网络中的节点。本发明实施例中的技术方案,能够在对等网络中根据用户的下载历史,向用户推荐其感兴趣的下载任务,从而为用户提供个性化的下载推荐服务。

    提供下载推荐服务的方法、结构化对等网络和其中的节点

    公开(公告)号:CN101399738A

    公开(公告)日:2009-04-01

    申请号:CN200710151589.5

    申请日:2007-09-28

    Abstract: 本发明实施例公开了一种基于结构化对等网络的提供下载推荐服务方法和下载方法。利用位置敏感哈希函数,将对等网络中符合预定条件的每一个节点的下载记录哈希保存到对等网络中相应的节点上;对于当前节点,利用所述位置敏感哈希函数对该当前节点的下载记录进行哈希处理得到键值,根据负责索引所得键值中的至少一个键值的各个节点所保存的索引日志,获得当前节点的下载推荐列表;当前节点根据下载推荐列表进行下载。本发明实施例还公开了一种结构化的对等网络和三种结构化的对等网络中的节点。本发明实施例中的技术方案,能够在对等网络中根据用户的下载历史,向用户推荐其感兴趣的下载任务,从而为用户提供个性化的下载推荐服务。

    意向驱动的博客搜索以及浏览系统

    公开(公告)号:CN101000632A

    公开(公告)日:2007-07-18

    申请号:CN200710036340.X

    申请日:2007-01-11

    Abstract: 一种意向驱动的博客搜索以及浏览系统,属于信息技术领域。本发明中,交互式的界面模块,接受用户输入的信息需求,通过该界面实现用户与博客文章搜索模块、博客搜索模块和单个博客内部浏览模块的交互式操作,并接受上述三种模块的最后结果;博客文章属于信息型和情感型的置信度计算模块完成文章属于信息型和情感型的置信度的计算;博客文章搜索模块完成对博客文章进行搜索时搜索结果排序;博客搜索模块完成对博客进行搜索时搜索结果排序;单个博客内部的文章浏览模块完成对单个博客内部的文章进行浏览。本发明可使与用户需求最相关的博客内容排在前面,提高了博客搜索的查准率,以及单个博客的内容进行浏览的效率,提高了用户体验和满意度。

Patent Agency Ranking