社交媒体用户表征模型,模型的预训练方法、文本图框架

    公开(公告)号:CN117421648A

    公开(公告)日:2024-01-19

    申请号:CN202311078580.1

    申请日:2023-08-25

    Applicant: 复旦大学

    Inventor: 魏忠钰 吴焜

    Abstract: 本发明的目的提供一种社交媒体用户表征模型,模型的预训练方法、以及模型设计中的文本图框架,所述方法包括:通过对社交媒体用户的言论进行分词来构建不同粒度的文本语义表示,通过点互信息方法构建文本之间的关系,进一步通过文本图模型构建用户表示;基于社交网络中的用户关注信息,在预训练阶段构建了多个自监督训练任务,通过用户间、用户内两个层次的任务,训练模型能够对不同社群下的不同用户、不同社群下的同一用户的表示进行分辨,得到融合社交媒体通用结构信息的用户表征模型以完成下游的多种社交媒体用户级别任务。

Patent Agency Ranking