一种基于大语言模型的隐私保护用户画像分析方法

    公开(公告)号:CN118013587A

    公开(公告)日:2024-05-10

    申请号:CN202410330981.X

    申请日:2024-03-22

    Applicant: 南京大学

    Inventor: 吴伟鹏 华景煜

    Abstract: 本发明公开一种基于大语言模型的隐私保护用户画像分析方法,借助大模型能力,在保护用户隐私的基础上揭示可通过短信分析出的用户画像。在用户本地获取所有短信作为输入,使用针对短信数据集微调的私有化语言分类模型,对短信数据中涉及隐私的隐私词进行提取,替换成对应的替代词以保护用户隐私,得到隐私安全的短信数据;将短信数据交给编写的Langchain应用,涉及对长输入的处理,不同用户画像信息的提示词模板等输入输出流,结合开源的大语言模型接口,分析得到用户画像,包括用户年龄、住址、消费习惯、兴趣爱好、教育程度、收入水平等用户画像信息。本发明既可以保护用户的隐私,又可以保证大语言模型的有效性和实用性。

Patent Agency Ranking