-
公开(公告)号:CN118797547A
公开(公告)日:2024-10-18
申请号:CN202311340624.3
申请日:2023-10-16
Applicant: 中移在线服务有限公司 , 中国移动通信集团有限公司
IPC: G06F18/25 , G06F40/289 , G06V30/42 , G06V10/82 , G06N3/04
Abstract: 本申请涉及数据融合技术领域,提供了一种多特征企业数据融合方法、装置、电子设备和存储介质,包括获取目标格式的企业数据,确定第一待融合数据集;基于第一预设企业数据特征对所述第一待融合数据集进行数据匹配,根据匹配未成功的所述企业数据确定第二待融合数据集;基于预设命名特征匹配算法和预设集成学习算法中的至少一个对所述第二待融合数据集进行数据融合。本申请实施例通过预设命名特征匹配算法和预设集成学习算法对匹配未成功的企业数据进行数据融合,提高识别范围覆盖率,降低了营销机会丢失的可能性。
-
公开(公告)号:CN116992880A
公开(公告)日:2023-11-03
申请号:CN202310838486.5
申请日:2023-07-10
Applicant: 中移在线服务有限公司 , 中国移动通信集团有限公司
IPC: G06F40/295 , G06F16/35 , G06F16/9537 , G06F40/30 , G06N3/0455
Abstract: 本发明提供一种建筑物名称的识别方法、装置、电子设备和存储介质,涉及人工智能技术领域。其中方法包括:获取待查询企业的企业数据;基于预设的多层级算法,从所述企业数据中识别出所述待查询企业所属的建筑物的目标名称;其中,所述多层级算法至少包括BERT‑CRF算法与电子围栏算法。本发明利用包括BERT‑CRF算法与电子围栏算法的多层级算法识别建筑物名称,以避免不能精准识别带有方位词的名称,还弥补了利用注册地址无法识别的缺口,使可识别的数据的覆盖范围更加全面,匹配更加精准,进而提高了识别建筑物名称的准确率。
-
公开(公告)号:CN117216348A
公开(公告)日:2023-12-12
申请号:CN202311089074.2
申请日:2023-08-28
Applicant: 中移在线服务有限公司 , 中国移动通信集团有限公司
IPC: G06F16/951 , G06F16/9535 , G06F16/9537 , H04L67/1396
Abstract: 本申请涉及大数据技术领域,提供了一种数据分级采集方法、装置、电子设备和存储介质,包括获取种子账号的历史采集数据,根据历史采集数据,确定种子账号的活跃度指数;根据活跃度指数,确定种子账号的账号等级;根据账号等级,确定与账号等级对应的采集节点部署量和轮询账号量;根据采集节点部署量和轮询账号量,对种子账号进行数据采集。本申请通过活跃度指数对种子账号进行分级,根据账号等级,确定与账号等级对应的采集节点部署量和轮询账号量;根据采集节点部署量和轮询账号量,对种子账号进行数据采集,实现了账号等级的动态调整和采集资源的灵活配置,无需人工配置,提高了数据采集自动化程度。
-
-