一种用于供应链监控的大数据提取方法及装置

    公开(公告)号:CN114238383A

    公开(公告)日:2022-03-25

    申请号:CN202111569266.4

    申请日:2021-12-21

    Abstract: 本发明公开了一种用于供应链监控的大数据提取方法及装置。其中,该方法包括:获取供应链信息,其中,所述供应链信息包括:货物信息、设备信息、运输信息;根据所述供应链信息计算供应链信息的复杂度o;通过所述复杂度o进行阈值判断,或者进行复杂度‑大数据矩阵解析,得到数据获取参数;根据所述数据获取参数获取数据汇总结果和判断结果,其中,判断结果包括:异常信息、非异常信息。本发明解决了现有技术中的供应链监控方式仅仅从单一供应链数据采集节点进行数据采集和比对算法操作,这样降低了多供应链节点的对比,而且没有供应链节点实时的统一更新和监测控制,同时在大数据的数据源提取的时候,无法根据供应链自身的运行情况以及复杂程度,智能地进行获取,增加了计算资源的负担,从而降低了供应链监控的效率和准确率的技术问题。

    目标行业词库的生成方法、处理器及装置

    公开(公告)号:CN113779200A

    公开(公告)日:2021-12-10

    申请号:CN202111075093.0

    申请日:2021-09-14

    Abstract: 本申请实施例提供一种目标行业词库的生成方法、处理器及装置。方法包括:获取目标行业语料;对目标行业语料进行语料清洗以确定可用语料;对可用语料进行新词识别以确定新词集合;根据可用语料和新词集合确定短语集合;对新词集合与短语集合进行近义归纳;对近义归纳后的新词集合和短语集合进行过滤去重、人工筛检和词性标注,以生成目标行业词库。提高了行业词库生成的自动化程度,降低了人工统计行业术语或行业新词的工作量与参与度。同时,提升行业词库覆盖的全面性,与词库统计的准确性;将通过此方法获得的行业词库应用于行业文本挖掘任务中,基于其对分词环节带来的优化,能极大提高后续文本挖掘任务的效果。

Patent Agency Ranking