-
公开(公告)号:CN118013587A
公开(公告)日:2024-05-10
申请号:CN202410330981.X
申请日:2024-03-22
Applicant: 南京大学
IPC: G06F21/62 , G06F40/186 , G06F40/30 , G06F40/284
Abstract: 本发明公开一种基于大语言模型的隐私保护用户画像分析方法,借助大模型能力,在保护用户隐私的基础上揭示可通过短信分析出的用户画像。在用户本地获取所有短信作为输入,使用针对短信数据集微调的私有化语言分类模型,对短信数据中涉及隐私的隐私词进行提取,替换成对应的替代词以保护用户隐私,得到隐私安全的短信数据;将短信数据交给编写的Langchain应用,涉及对长输入的处理,不同用户画像信息的提示词模板等输入输出流,结合开源的大语言模型接口,分析得到用户画像,包括用户年龄、住址、消费习惯、兴趣爱好、教育程度、收入水平等用户画像信息。本发明既可以保护用户的隐私,又可以保证大语言模型的有效性和实用性。