一种基于Decision Transformer模型的建筑能耗优化方法

    公开(公告)号:CN118569313A

    公开(公告)日:2024-08-30

    申请号:CN202410637921.2

    申请日:2024-05-21

    Abstract: 本发明公开了一种基于Decision Transformer模型的建筑能耗优化方法,属于建筑能耗管理技术领域,首先定义建筑能耗管理场景下的马尔科夫决策过程要素,包括状态、动作和奖励机制,并收集相应的专家决策数据;然后对奖励进行重标记,将每个决策点后的累积奖励表示为轨迹回报R,重构输入轨迹序列,为决策模型提供预训练数据集;最后通过Decision Transformer模型训练重构输入轨迹序列,对Decision Transformer中的注意力机制进行因果掩码的修正,针对连续动作设计相应的损失函数,使用建模的轨迹序列对模型进行多轮训练,直至收敛,获得最优建筑能耗管理策略,并在新任务下进行测试。本发明提供的方法在新任务下有强大的迁移泛化性能,为提高建筑能耗管理质量提供了新的解决思路与方案。

    一种基于深度Q学习的交通信号控制方法

    公开(公告)号:CN111653106A

    公开(公告)日:2020-09-11

    申请号:CN202010294012.5

    申请日:2020-04-15

    Inventor: 黄亚男 曾振平

    Abstract: 本发明公开了一种基于深度Q学习的交通信号控制方法,构建交通流与单交叉口环境;构建深度Q学习模型,使用卷积神经网络作为Q值的逼近函数,其中卷积神经网络包括若干卷积层和一个全连接层,网络的激活函数是relu函数,损失函数是均方误差函数,优化器是AdamOptimizer优化器,输入数据经过卷积层和全连接层后得到最后的输出;设置训练参数训练深度Q学习模型;采集实际交叉口的汽车位置和速度,确定交通信号控制动作。本发明通过学习动作与状态变化之间的样本数据来得出最优的策略,适于时变的交通流与复杂的环境,能够有效避免实际操作中维度爆炸问题的出现。

    一种异构网络的网络选择优化方法

    公开(公告)号:CN105491627A

    公开(公告)日:2016-04-13

    申请号:CN201510916034.X

    申请日:2015-12-10

    CPC classification number: H04W36/0066 H04W36/14 H04W36/30

    Abstract: 本发明提供一种能根据实时的网络情况进行接入网络选择方法,所述异构网为蜂窝网络与WLAN共存的异构网,所述第一网络为蜂窝网络,所述第二网络为WLAN。当设备现在所连接的第一网络服务不理想时,根据ANDSF和RAN Rules提供的网络列表,设备将流量卸载在排名第一的网络,当第一网络负载过高或网络拥堵时,设备能及时切换至第二网络。本发明改善了不能及时对更优化的网络进行选择的缺点,提高了网络性能,最大化资源利用率。

    一种基于改进Decision Transformer模型的基站能耗优化方法

    公开(公告)号:CN118945684A

    公开(公告)日:2024-11-12

    申请号:CN202410911854.9

    申请日:2024-07-08

    Abstract: 本发明公开了一种基于改进Decision Transformer模型的基站能耗优化方法,属于基站能耗管理领域,包括对环境进行建模,并用强化学习生成决策数据集,计算决策数据集中轨迹回报,对计算的轨迹回报通过Bootstrap方法计算每个时间步的均值μt和标准差σt,建模数据样本的分布;对轨迹回报进行标准化处理,计算其在数据样本中的距离分布,并进行归一化处理,作为轨迹序列的提示Pt;重构输入轨迹序列τ,使用DecisionTransformer模型对重构的轨迹序列τ进行训练,直至收敛,获得最优的基站能耗管理策略。本发明采用上述的一种基于改进Decision Transformer模型的基站能耗优化方法,改进了Decision Transformer模型对数据集质量过度依赖的问题,克服了模型无法学习到最优策略的缺陷,为降低基站能耗提供了新的解决思路与方案。

    基于聚类PPO算法的多移动机器人合作的路径规划方法

    公开(公告)号:CN117873089A

    公开(公告)日:2024-04-12

    申请号:CN202410036441.0

    申请日:2024-01-10

    Abstract: 本发明公开了基于聚类PPO算法的多移动机器人合作的路径规划方法,包括以下步骤:S1、收集所有目标的位置信息,对目标数据进行清洗和标准化处理;S2、利用K‑均值聚类算法进行目标节点分配;S3、利用PPO算法优化每个移动机器人的路径;S4、利用PPO算法更新策略网络,当策略网络稳定或者达到预设的迭代次数时,停止训练。本发明采用上述的基于聚类PPO算法的多移动机器人合作的路径规划方法,在保证求解效率的同时,找到接近最小最大化任务完成时间的解,这种结合了聚类算法和深度强化学习算法的方法为路径规划的求解提供了新的思路,对于提升仓储效率、降低运输成本具有重要的实际应用价值。

    基于LTCC技术的新型超宽带带通滤波器

    公开(公告)号:CN114335940B

    公开(公告)日:2023-04-28

    申请号:CN202111309605.5

    申请日:2021-11-06

    Abstract: 本发明公开了一种基于LTCC技术的新型超宽带带通滤波器,使用LTCC工艺技术实现滤波器的立体三维集成,包括滤波器、特性阻抗为50欧姆的输入端口和输出端口、上接地板、下接地板、前接地板、后接地板;特性阻抗为50欧姆的输入端口位于滤波器F的左边,特性阻抗为50欧姆的输出端口位于滤波器F的右边,上接地板位于滤波器F的上边,下接地板位于滤波器F的下边,滤波器F的前边设有前接地板,滤波器F的后边设有后接地板。本发明不仅提高了带外抑制,而且减小了滤波器的体积,设计的超宽带带通滤波器具有高性能、小型化的优势。

    一种基于LTCC技术的复合结构双工器

    公开(公告)号:CN112928407B

    公开(公告)日:2022-05-24

    申请号:CN202110090037.8

    申请日:2021-01-22

    Abstract: 本发明提出了一种基于LTCC技术的复合结构双工器,由两个带通滤波器组成,其中一个带通滤波器采用交指加载电容型结构,另一个滤波器采用金属柱加载接地电容结构,两个滤波器采用T型结连接。本发明能使输入信号实现对两个异频信号的合路或单个宽频信号的频段分割,适用于相应微波频段的移动通信、无线通信手持终端等,对电性能、材料一致性、温度稳定性以及对体积有苛刻要求的场合和相应的系统中。

    一种基于车载传感器系统的室内环境动态目标检测方法

    公开(公告)号:CN119758286A

    公开(公告)日:2025-04-04

    申请号:CN202510005114.3

    申请日:2025-01-02

    Abstract: 本发明公开了一种基于车载传感器系统的室内环境动态目标检测方法,采集激光雷达数据和毫米波雷达数据;使用DBSCAN算法对预处理后的激光雷达数据进行预聚类,依据各个方向点云分布方差均值更新欧氏距离计算公式,使用更新后欧式距离计算公式对预处理后的激光雷达数据进行改进的DBSCAN聚类,得到激光雷达目标最终聚类簇集合;构建扩展卡尔曼滤波跟踪器对激光雷达目标的位置进行跟踪,计算目标的位移、速度和运动方向信息;从毫米波雷达数据中提取出多普勒速度以及方位角信息,计算多普勒速度在车辆运动方向的映射,计算车辆运动方向速度值分布曲线,寻找分布曲线峰值处速度值为车辆自运动速度;计算目标绝对运动速度,判断是否为运动目标。本发明可以减少算法开销,保证检测实时性。

Patent Agency Ranking