-
公开(公告)号:CN110196974B
公开(公告)日:2023-07-07
申请号:CN201910501539.8
申请日:2019-06-11
Applicant: 吉林大学
IPC: G06F40/18 , G06F40/289 , G06F16/35
Abstract: 本发明公开了一种用于大数据清洗的快速数据聚合方法,包括以下步骤:数据读取:原有的数据是在Excel中存储的,利用文件流的形式读取出Excel中的数据信息,根据数据的格式,将读取出来的数据信息存储在记录列表中,最后返回一个记录列表;对大数据文本进行切分;进行文本相似度比较;聚合结果的显示和修改:将要显示的表单打印出来并且提供给用户修改和删除,修改完成后,进行表单的下载。
-
公开(公告)号:CN110196974A
公开(公告)日:2019-09-03
申请号:CN201910501539.8
申请日:2019-06-11
Applicant: 吉林大学
Abstract: 本发明公开了一种用于大数据清洗的快速数据聚合方法,包括以下步骤:数据读取:原有的数据是在Excel中存储的,利用文件流的形式读取出Excel中的数据信息,根据数据的格式,将读取出来的数据信息存储在记录列表中,最后返回一个记录列表;对大数据文本进行切分;进行文本相似度比较;聚合结果的显示和修改:将要显示的表单打印出来并且提供给用户修改和删除,修改完成后,进行表单的下载。
-