-
公开(公告)号:CN118673102B
公开(公告)日:2024-11-05
申请号:CN202411164470.1
申请日:2024-08-23
Applicant: 清华大学
IPC: G06F16/33 , G06F16/9537 , G06Q50/50 , G06N5/04
Abstract: 本发明涉及人工智能技术领域,提供一种基于大语言模型的人类移动行为生成方法及系统,该方法基于人物画像数据库,确定上下文感知的提示词;基于上下文感知的提示词,使用大语言模型的思维链机制,推理生成完整的移动意图模板;输入完整的移动意图模板至预训练的机制模型,获得机制模型输出的映射到真实地理位置的人类移动行为;机制模型用于基于与完整的移动意图模板对应的移动距离,对完整的移动意图模板进行真实地理位置映射。本发明利用人物画像来指定大语言模型所扮演的角色,再通过大语言模型的逐步推理来生成高层次的移动意图,最后用机制模型将抽象意图模板映射到真实地理位置,能够实现准确、高效、富语义感知的人体移动行为生成。
-
公开(公告)号:CN110309434B
公开(公告)日:2023-10-13
申请号:CN201811178191.5
申请日:2018-10-10
Applicant: 腾讯大地通途(北京)科技有限公司 , 腾讯科技(深圳)有限公司 , 清华大学
IPC: G06F16/9537
Abstract: 本发明实施例公开了一种轨迹数据处理方法、装置以及相关设备,方法包括:获取用户行为轨迹数据,并获取与用户行为轨迹数据相关联的用户时间信息;根据用户行为轨迹数据和用户时间信息设置多个时空点;一个时空点对应一个时间段内的一个位置区域;根据用户轨迹数据,提取各时空点分别对应的目标表征向量;根据目标表征向量,分别确定每个时空点与多种位置兴趣点类别之间的访问频率。采用本发明,可以提高识别不同区域在不同时段各类POI的访问频率的正确率。
-
公开(公告)号:CN110309434A
公开(公告)日:2019-10-08
申请号:CN201811178191.5
申请日:2018-10-10
Applicant: 腾讯大地通途(北京)科技有限公司 , 腾讯科技(深圳)有限公司 , 清华大学
IPC: G06F16/9537
Abstract: 本发明实施例公开了一种轨迹数据处理方法、装置以及相关设备,方法包括:获取用户行为轨迹数据,并获取与用户行为轨迹数据相关联的用户时间信息;根据用户行为轨迹数据和用户时间信息设置多个时空点;一个时空点对应一个时间段内的一个位置区域;根据用户轨迹数据,提取各时空点分别对应的目标表征向量;根据目标表征向量,分别确定每个时空点与多种位置兴趣点类别之间的访问频率。采用本发明,可以提高识别不同区域在不同时段各类POI的访问频率的正确率。
-
公开(公告)号:CN118673103A
公开(公告)日:2024-09-20
申请号:CN202411164473.5
申请日:2024-08-23
Applicant: 清华大学
IPC: G06F16/33 , G06F16/35 , G06F16/901 , G06F16/906
Abstract: 本发明涉及人工智能技术领域,提供一种基于大语言模型的异质图元结构发现方法及系统,该方法包括:确定异质图的候选元结构;将异质图的候选元结构输入元结构选择的大语言模型,得到元结构选择的大语言模型输出的选择的元结构;基于遗传算法对选择的元结构进行优化,重复迭代执行确定异质图的候选元结构的步骤和输入元结构选择的大语言模型的步骤,直至完成预设迭代次数,得到发现的元结构;将发现的元结构输入差分解释的大语言模型,得到差分解释的大语言模型输出的语义解释。本发明利用大语言模型的推理能力,以下游任务需求为导向,能够实现兼顾预测性能与可解释性的元结构发现,通用性较强。
-
公开(公告)号:CN111695046A
公开(公告)日:2020-09-22
申请号:CN202010328213.2
申请日:2020-04-23
Applicant: 清华大学
IPC: G06F16/9537 , G06K9/62 , G06N20/10
Abstract: 本发明实施例提供一种基于时空移动数据表征学习的用户画像推断方法及装置,该方法包括:获取多个用户和用户访问的地点数据,以用户与用户的边长权重表示用户时空模式的相似度,地点与地点的边长权重表示地点功能上的相似度,用户与地点的边长权重表示用户访问地点的频率,得到保留语义的移动网络;获取使预设的目标函数最小时的用户表示向量,输入预设的机器学习分类模型,获取用户画像的推断结果;其中,所述目标函数根据上述三类边长权重,以及用户表示向量和地点表示向量构建得到。该方法无需人为进行大量的特征生成与特征筛选,训练模型的效率较高,有效节约人力成本,且能够有效保障模型性能,进而实现了基于移动数据准确的用户属性推断。
-
公开(公告)号:CN118673103B
公开(公告)日:2024-10-29
申请号:CN202411164473.5
申请日:2024-08-23
Applicant: 清华大学
IPC: G06F16/33 , G06F16/35 , G06F16/901 , G06F16/906
Abstract: 本发明涉及人工智能技术领域,提供一种基于大语言模型的异质图元结构发现方法及系统,该方法包括:确定异质图的候选元结构;将异质图的候选元结构输入元结构选择的大语言模型,得到元结构选择的大语言模型输出的选择的元结构;基于遗传算法对选择的元结构进行优化,重复迭代执行确定异质图的候选元结构的步骤和输入元结构选择的大语言模型的步骤,直至完成预设迭代次数,得到发现的元结构;将发现的元结构输入差分解释的大语言模型,得到差分解释的大语言模型输出的语义解释。本发明利用大语言模型的推理能力,以下游任务需求为导向,能够实现兼顾预测性能与可解释性的元结构发现,通用性较强。
-
公开(公告)号:CN118673102A
公开(公告)日:2024-09-20
申请号:CN202411164470.1
申请日:2024-08-23
Applicant: 清华大学
IPC: G06F16/33 , G06F16/9537 , G06Q50/50 , G06N5/04
Abstract: 本发明涉及人工智能技术领域,提供一种基于大语言模型的人类移动行为生成方法及系统,该方法基于人物画像数据库,确定上下文感知的提示词;基于上下文感知的提示词,使用大语言模型的思维链机制,推理生成完整的移动意图模板;输入完整的移动意图模板至预训练的机制模型,获得机制模型输出的映射到真实地理位置的人类移动行为;机制模型用于基于与完整的移动意图模板对应的移动距离,对完整的移动意图模板进行真实地理位置映射。本发明利用人物画像来指定大语言模型所扮演的角色,再通过大语言模型的逐步推理来生成高层次的移动意图,最后用机制模型将抽象意图模板映射到真实地理位置,能够实现准确、高效、富语义感知的人体移动行为生成。
-
公开(公告)号:CN110196891B
公开(公告)日:2024-03-15
申请号:CN201811361868.9
申请日:2018-11-15
Applicant: 腾讯大地通途(北京)科技有限公司 , 腾讯科技(深圳)有限公司 , 清华大学
IPC: G06F16/29
Abstract: 本发明公开了一种街区类型的确定方法、装置、存储介质及电子装置。其中,该方法包括:在客户端上获取到第一请求,其中,第一请求用于请求获取目标街区的类型;响应第一请求获取目标街区的类型,其中,目标街区的类型根据街区之间已产生的帐号轨迹数据产生,帐号轨迹数据包括:具有关联关系的帐号、帐号产生的运动轨迹、运动轨迹经过的街区和运动轨迹产生的时间,街区包括目标街区;在客户端上显示目标街区的类型。本发明解决了相关技术对街区类型进行识别的准确性较低的技术问题。
-
公开(公告)号:CN111695719A
公开(公告)日:2020-09-22
申请号:CN202010313398.X
申请日:2020-04-20
Applicant: 清华大学 , 杭州贝购科技有限公司
IPC: G06Q10/04 , G06K9/62 , G06N3/04 , G06N3/08 , G06F16/9535 , G06F16/9536
Abstract: 本发明实施例提供一种用户价值预测方法及系统,该方法包括:获取每个用户的画像信息、交易历史信息和社交互动信息,并将画像信息和交易历史信息输入到多层神经网络中,构建每个用户的表征向量;根据社交互动信息和表征向量,构建用户之间的社交网络,并根据社交网络构建对应的母版网络;将社交网络和母版网络分别输入到图神经网络中,得到多个图表征向量,并通过注意力机制将多个图表征向量进行融合,得到图表征目标向量;将图表征目标向量输入到训练好的用户价值预测模型,得到用户价值的预测值。本发明实施例充分利用了用户自身的画像、交易历史等信息,并利用了用户之间的社交关系中的隐藏信息,使得用户价值预测结果更为精准。
-
公开(公告)号:CN118760898B
公开(公告)日:2024-12-31
申请号:CN202411245264.3
申请日:2024-09-06
Applicant: 清华大学
IPC: G06F18/214 , G06F40/289 , G06F40/35 , G06N5/025
Abstract: 本公开涉及人工智能领域,尤其涉及面向城市领域的大语言模型训练方法及城市生成式智能方法、装置,所述训练方法包括:获取通用大语言模型以及初始数据集;通过在虚拟城市场景中设置智能体模拟人类在真实城市场景中的多种行为,得到复合数据集;将复合数据集与初始数据集混合为预训练数据集,并利用预训练数据集对通用大语言模型进行增量预训练,得到第一城市大模型;利用针对城市领域构建的微调数据集对第一城市大模型进行微调训练,得到第二城市大模型;利用人类偏好数据集对第二城市大模型进行偏好对齐训练,得到目标城市大模型。由此,能够得到具有城市领域专业知识、世界通用常识以及认知推理能力的目标城市大模型。
-
-
-
-
-
-
-
-
-