一种基于大语言模型的通用图任务方法

    公开(公告)号:CN119249202A

    公开(公告)日:2025-01-03

    申请号:CN202411335296.2

    申请日:2024-09-24

    Applicant: 东南大学

    Inventor: 孔佑勇 司清华

    Abstract: 本发明涉及一种基于大语言模型(LLM)的通用图任务方法,该方法首先将图结构数据序列化为适合LLM的输入,通过RWPE(Random Walk Positional Embedding)和基于拉普拉斯分解的位置编码LAPE(Laplacian Positional Embedding)这两种编码将图的结构信息注入到模型当中完成通用序列化过程。随后根据不同的任务,进行不同的序列化,包括图分类任务中的子图切分排列与节点分类任务中的局部领域采样。在得到完全序列化的数据后,通过对预训练大模型冻结和微调的方式进行知识注入,最终本框架在图任务领域(图分类,节点分类)取得了出色的表现,并且在多个数据集上验证了框架效果,同时进行了可解释性实验与小样本场景验证实验,进一步证明了框架的优越性。

    一种基于时空图常微分方程的地铁客流量预测方法及系统

    公开(公告)号:CN117592602A

    公开(公告)日:2024-02-23

    申请号:CN202311557188.5

    申请日:2023-11-21

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于时空图常微分方程的地铁客流量预测方法及系统,所述方法包括下述步骤:采集并处理原始地铁AFC历史数据,利用地理拓扑信息和原始历史客流量数据构建一组地铁网络时空关系图;将处理后得到的历史客流量和图组作为模型输入;建立一种新的地铁客流量预测网络,在每个时空层中,利用两个时序自注意力模块和时序卷积模块来获取节点之间的动态多尺度的时间依赖性,利用基于张量的常微分方程来捕获空间依赖性,并通过跳跃连接将每个时空层得到的隐藏状态馈送到输出层,对未来时刻地铁客流量进行预测。本发明能够有效结合时空特征,有效减轻图神经网络中常见的过平滑问题,在地铁客流量数据集中实现较好预测性能。

Patent Agency Ranking