一种基于交叉路口转移计算的交通预测方法

    公开(公告)号:CN112989539A

    公开(公告)日:2021-06-18

    申请号:CN202110373408.3

    申请日:2021-04-07

    Abstract: 本发明公开了一种基于交叉路口转移计算的交通预测方法,涉及交通预测领域,通过包含了路段和路口的地理信息以及路网的拓扑数据的路网属性图学习转移矩阵,根据交通历史数据,通过堆叠的包含了门控时序卷积网络和交叉路口转移图卷积网络的时空特征挖掘模块对未来的交通进行预测。本发明将图卷积神经网络应用到交通预测领域,提供了一种精准的交通预测方法,不仅能够作为政府部门的决策依据,帮助政府实行更科学有效的交通管控,也可以给市民提供更充足的路况信息,帮助驾驶员做出更优的路径选择。

    一种基于双向模型的强化学习方法

    公开(公告)号:CN111950735B

    公开(公告)日:2023-11-17

    申请号:CN202010622636.5

    申请日:2020-06-30

    Inventor: 张伟楠 赖行 沈键

    Abstract: 一种基于双向模型的强化学习方法,用于机器人控制,其特征在于,包括:正向模型、反向模型、正向策略、反向策略,从某真实的状态开始,双向地生成轨迹,在三个阶段不断进行迭代:数据搜集阶段、模型学习阶段、策略优化阶段,直到算法收敛。本发明的有益效果是:双向模型相比于传统正向模型,在生成相同长度的虚拟轨迹的情况下的模型累积误差更小,且在进一步的仿真控制实验中,本发明的方法相比于之前的基于模型方法,无论采样效率还是渐进性能都更加优秀。

    一种基于时间和图结构的搜索式推荐方法

    公开(公告)号:CN115953215B

    公开(公告)日:2023-09-05

    申请号:CN202211533857.0

    申请日:2022-12-01

    Abstract: 本发明公开了一种基于时间和图结构的搜索式推荐方法,涉及推荐系统领域,包括以下步骤:收集互联网平台用户行为历史数据,使用内积神经网络对用户和历史数据中的物品进行编码,并计算用户和物品的嵌入向量,对历史物品进行建图、采样和学习,将物品的嵌入向量输入模型中,基于用户和物品特征,在用户历史数据中检索相似物品和相似用户,从相似用户的历史数据中检索目标物品的相似物品;将检索得到的用户历史序列输入时间感知模型中得到隐状态序列,将隐状态序列输入多层感知机中进行预测并进行反向传播,将训练完毕的算法模型应用于推荐算法中。本发明提出的推荐方法,能够在在线环境下处理大规模的用户历史序列,能有效提升推荐效率和表现。

    一种基于高效混合整数规划分支策略的工业生产调度方法

    公开(公告)号:CN115204714A

    公开(公告)日:2022-10-18

    申请号:CN202210888017.X

    申请日:2022-07-25

    Inventor: 黄泽人 张伟楠

    Abstract: 本发明公开了一种基于高效混合整数规划分支策略的工业生产调度方法,涉及工业生产调度领域,将工业中生产调度等决策问题通过混合整数规划问题建模,所述混合整数规划问题建模的主体框架为分支切割方法,在所述分支切割方法引入基于学习的分支策略。本发明利用效率更高的、分支决策时更具长远眼光的分支策略,进而提升工业任务的解决效率。

    一种面向收益提升的无偏学习排序方法

    公开(公告)号:CN112612951B

    公开(公告)日:2022-07-01

    申请号:CN202011491942.6

    申请日:2020-12-17

    Abstract: 本发明公开了一种面向收益提升的无偏学习排序方法,基于有偏的用户点击日志数据,直接优化一个无偏的效益指标。首先学习了一个位置敏感的点击率预估模型,建模不同特征的查询‑文档对在不同位置下的点击率,得到的用户效益的无偏估计,基于lambdaloss的学习框架提出了一个基于lambdaloss的目标函数来直接优化用户效益的无偏估计,通过学习一个打分函数可以将测试阶段的复杂度降低到O(N)。理论分析证明该目标函数可以优化目标效益的一个有效上界。本发明在三个公开数据集上都证明了该方法的有效性,可以被用于列表推荐,网页搜索,广告系统等场景。

    一种基于图卷积网络的多标签文本分类方法

    公开(公告)号:CN114020920A

    公开(公告)日:2022-02-08

    申请号:CN202111418020.7

    申请日:2021-11-26

    Abstract: 本发明公开了一种基于图神经网络的多标签文本分类方法,涉及自然语言处理领域。包括以下步骤:通过文本编码器提取待分类文本的文本语义向量;建立以类别标签为节点的图G;将图G输入图卷积网络,得到每个类别标签的节点表示向量;将类别标签的节点表示向量与额外定义的类别表达向量结合,得到分类层融合权重;将文本语义向量输入分类层,根据分类层融合权重,对文本进行类别预测。该方法可以在各种文本体裁的多标签文本分类中提升模型的性能,并且能与BERT、Elmo等强大的预训练文本特征提取器结合,可以用于实际多标签文本分类系统中,提升分类效果。

    一种基于鲁棒模仿学习的模拟器建模方法

    公开(公告)号:CN113239634A

    公开(公告)日:2021-08-10

    申请号:CN202110654854.1

    申请日:2021-06-11

    Abstract: 本发明公开了一种基于鲁棒模仿学习的模拟器建模方法,涉及强化学习领域,包括以下步骤:从策略分布中采样出训练策略集合Π和测试策略集合Π′;令训练策略集合Π的策略π与真实环境p*进行交互,以获得真实数据集合Bπ={(s,a,s′)~(πp*);每k步进行一次策略筛选;令策略π与学习到的模拟器进行交互,并计算价值差异VD,以衡量模拟器在策略π下的表现;选取其中表现最差的∈%策略构成集合Πc,其对应的数据集记为Bc;从Bc中采样数据,并利用Πc中的策略与当前模拟器交互以收集数据Dp,用以优化生成对抗模仿学习中的判别器Dω,以及用以优化生成对抗模仿学习中的生成器重复上述步骤直到重复次数达到事先设定的阈值。该方法使得学到的模型具有更强的鲁棒性。

    一种基于模型的多智能体强化学习方法

    公开(公告)号:CN112183288A

    公开(公告)日:2021-01-05

    申请号:CN202011002376.8

    申请日:2020-09-22

    Abstract: 本发明公开了一种基于模型的多智能体强化学习方法,属于多智能体强化学习领域,包括对多智能体环境和策略建模,生成多智能体的虚拟轨迹,利用虚拟轨迹更新多智能体的策略。本发明中各智能体分布式进行决策,分别对多智能体环境与对手智能体策略建模,并利用习得的模型生成虚拟轨迹,能够有效提高多智能体强化学习的采样效率,同时减少智能体交互次数降低设备损坏风险,提高了将分布式多智能体强化学习方法部署在多智能体任务的可行性。

    一种基于数据模仿和课程学习的离线强化学习方法

    公开(公告)号:CN114219085B

    公开(公告)日:2025-03-28

    申请号:CN202111544237.2

    申请日:2021-12-16

    Abstract: 本发明公开了一种基于数据模仿和课程学习的离线强化学习方法,涉及离线强化学习领域。该方法使用当前的学习到的策略,对数据集中的每条轨迹的每个数据点进行标记,标记为当前策略采样出该数据点的概率;对每条轨迹中的数据点排序;以beta分位点的数据作为该条轨迹的标记;无放回选择N条标记最大的轨迹;对选择的轨迹数据进行模仿学习;以先前选择的轨迹的奖励水平以滑动平均的方式更新奖励水平过滤器;过滤数据集中奖励水平低于过滤器值的轨迹。本发明基于模仿学习,通过课程学习的方式,逐步从数据集中选择合适的数据进行学习,从而可以稳定学习到数据集中的最好表现的策略,且可以避免现有技术中存在的误差累积的问题。

    一种基于图卷积网络的多标签文本分类方法

    公开(公告)号:CN114020920B

    公开(公告)日:2025-03-14

    申请号:CN202111418020.7

    申请日:2021-11-26

    Abstract: 本发明公开了一种基于图神经网络的多标签文本分类方法,涉及自然语言处理领域。包括以下步骤:通过文本编码器提取待分类文本的文本语义向量;建立以类别标签为节点的图G;将图G输入图卷积网络,得到每个类别标签的节点表示向量;将类别标签的节点表示向量与额外定义的类别表达向量结合,得到分类层融合权重;将文本语义向量输入分类层,根据分类层融合权重,对文本进行类别预测。该方法可以在各种文本体裁的多标签文本分类中提升模型的性能,并且能与BERT、Elmo等强大的预训练文本特征提取器结合,可以用于实际多标签文本分类系统中,提升分类效果。

Patent Agency Ranking