-
公开(公告)号:CN118467734B
公开(公告)日:2024-11-12
申请号:CN202410632156.5
申请日:2024-05-21
Applicant: 北京大数据先进技术研究院
IPC: G06F16/35 , G06F16/33 , G06F16/338 , G06F40/295 , G06F40/186
Abstract: 本申请提供了一种服务器无感知的信息抽取方法,涉及信息抽取技术领域,该方法包括:获取原始数据文件和信息抽取模板名称;对原始数据文件进行标准化预处理,转换为标准格式文件;根据信息抽取模板名称,在数据库中检索得到目标模板,目标模板至少包括:字段、每个字段的解释性文本、每个字段的备注信息;针对目标模板中的每个字段,获取一个或多个匹配的候选信息抽取函数;从候选信息抽取函数中,确定目标信息抽取函数;根据每个字段的目标信息抽取函数,生成信息抽取任务;利用标准格式文件,执行信息抽取任务,得到信息抽取结果。
-
公开(公告)号:CN118467734A
公开(公告)日:2024-08-09
申请号:CN202410632156.5
申请日:2024-05-21
Applicant: 北京大数据先进技术研究院
IPC: G06F16/35 , G06F16/33 , G06F16/338 , G06F40/295 , G06F40/186
Abstract: 本申请提供了一种服务器无感知的信息抽取方法,涉及信息抽取技术领域,该方法包括:获取原始数据文件和信息抽取模板名称;对原始数据文件进行标准化预处理,转换为标准格式文件;根据信息抽取模板名称,在数据库中检索得到目标模板,目标模板至少包括:字段、每个字段的解释性文本、每个字段的备注信息;针对目标模板中的每个字段,获取一个或多个匹配的候选信息抽取函数;从候选信息抽取函数中,确定目标信息抽取函数;根据每个字段的目标信息抽取函数,生成信息抽取任务;利用标准格式文件,执行信息抽取任务,得到信息抽取结果。
-