-
公开(公告)号:CN110851432A
公开(公告)日:2020-02-28
申请号:CN202010034181.5
申请日:2020-01-14
Applicant: 中软信息系统工程有限公司
IPC: G06F16/215 , G06F16/2458 , G06F16/25 , G06F16/28 , G06F16/951
Abstract: 本申请提供一种基于弹性分布式数据模型的多维度信息提取方法及装置,方法包括:获取第一预设格式的数据;利用弹性分布式数据模型对第一预设格式的数据进行数据处理;将数据处理后的数据依据维度进行数据标注;根据数据标注的结果生成数据维度表,以完成对第一预设格式的数据的信息提取。因此,可以根据网页数据以及业务数据得到第一预设格式的数据,然后利用弹性分布式数据模型对上述数据进行数据处理最终实现对网页数据以及业务数据的信息提取。其中,利用弹性分布式数据模型进行信息提取时,可以对海量的数据进行操作,从而增加信息提取的工作效率;同时,具有强大的复原能力,可以实现多维度的信息提取,从而充分展示数据之间的关联性。