-
公开(公告)号:CN119782612A
公开(公告)日:2025-04-08
申请号:CN202411850946.7
申请日:2024-12-16
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F16/9535 , G06F16/9536 , G06F16/35 , G06F16/335 , G06F16/334 , G06F40/289 , G06F40/30
Abstract: 本发明提供一种基于文本数据的性格预测方法和社交画像生成方法,包括采集用户发表的贴文数据并清洗处理以生成贴文数据,获取用户所有贴文数据以生成用户数据;LDA模型识别用户数据以获取主题数据和与主题对应的关键词数据;MBTI模型基于关键词数据确定与MBTI四个维度之间的映射关系,以确定用户MBTI的四个维度特征,基于四个维度特征预测用户的性格特征。本发明能够依据用户发布文本所包含的主题和关键词预测其性格特征,再依据性格特征生成用户画像。