-
公开(公告)号:CN116662472A
公开(公告)日:2023-08-29
申请号:CN202310695623.4
申请日:2023-06-13
Applicant: 国网信通亿力科技有限责任公司
IPC: G06F16/29 , G06F16/31 , G06F17/16 , G06N3/082 , G06F40/289 , G06F40/295 , G06F16/35 , G06N3/045 , G06F18/2415
Abstract: 本发明涉及深度学习技术领域,公开了一种基于非结构化地址数据构建结构化地址库的方法,包括以下步骤:构建初始地址树;从地址文本中提取地址要素;地址要素映射初始地址树;构建并训练地址要素纠错模型;使用地址要素纠错模型,并对地址要素进行纠错;对初始地址树进行剪枝获得最终地址树;本发明通过提取非结构化的地址文本中的地址要素,并通过神经网络模型对地址要素进行自动纠错,将非结构化的地址文本构建成结构化的地址树。