一种基于多层级文本表示及模型融合的用户画像生成方法

    公开(公告)号:CN113486143A

    公开(公告)日:2021-10-08

    申请号:CN202110569271.9

    申请日:2021-05-25

    Abstract: 本发明公开了一种基于多层级文本表示及模型融合的用户画像生成方法,利用真实用户的互联网搜索文本,通过文本预处理,分别从不同层级提取文本特征,经不同的神经网络分类,最后将各神经网络预测出的分类结果经二级分类器进行二次分类,以此实现用户特征画像。将真实用户的互联网搜索数据进行分词,分别生成单词级的向量表示,子词级向量表示和字符级向量表示,分别作为输入传入不同的深度神经网络进行分类,每个神经网络分类器的训练阶段皆使用k折交叉验证的方法,最后将每个一级分类模型得到的训练数据和测试数据的预测结果各自进行拼接,作为二级分类器的训练数据和测试数据进行再次分类,实现对互联网用户的准确画像。

Patent Agency Ranking