-
公开(公告)号:CN117235272A
公开(公告)日:2023-12-15
申请号:CN202310928625.3
申请日:2023-07-27
Applicant: 北京工业大学
IPC: G06F16/36 , G06F16/215 , G06F18/214 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于UIE模型的空气污染物文本信息抽取方法。该方法对空气污染投诉文本进行了污染源、污染时间和污染发生地点三元组信息的提取工作,对突发性、非时序性空气污染问题进行有效建模。本发明首先基于空气污染投诉预料数据的短文本结构特点,构建相应的UIE模型;其次,结合实际信息抽取要素要求、空气污染防治要求,对UIE模型有效性进行检验,并利用UIE模型对空气污染投诉文本进行文本语料三元组信息抽取工作;最后,对于提取出的文本语料三元组信息进行多维分析,包括时域统计、空间分析等,并建立面向空气污染投诉的特定知识图谱。本发明对时序预测模型进行了补充,同时更直观地展现污染物与污染发生地点之间的联系。