-
公开(公告)号:CN118332099A
公开(公告)日:2024-07-12
申请号:CN202410306329.4
申请日:2024-03-18
Applicant: 南开大学
IPC: G06F16/34 , G06F16/35 , G06F40/295
Abstract: 本发明提供一种基于NLP算法的程序隐私政策简化方法及系统,涉及文本处理技术领域,该方法包括爬取应用程序的隐私政策文本,获得语料库;对语料库内的数据集进行预处理,获得预处理数据;对预处理数据进行分类标注及特征向量构建,获得训练数据;基于训练数据进行多分类模型训练,并基于三元组抽取模型对实体抽取分类,以对长实体进行抽取进行命名实体类别模型训练,获得数据处理模型;通过数据处理模型对待处理的隐私政策文本进行预测,获得处理结果,并将处理结果进行可视化展示,本发明可以自动对隐私政策条款进行中文命名实体识别,并且显示更加清晰直观,还具备更高的普适性与可操作性。