-
公开(公告)号:CN114297199A
公开(公告)日:2022-04-08
申请号:CN202111636366.4
申请日:2021-12-29
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/22 , G06F16/215
Abstract: 本发明公开了一种基于关联可信度计算的数据筛选方法,包括以下步骤:收集数据资源,生成原始数据汇总表;清洗原始数据汇总表,生成汇总数据表;设计汇总数据表中关联字段可信度的评估指标,计算关联字段在每个指标下的可信度得分;采用变异系数法,计算所述评估指标的指标系数;结合所述可信度得分和所述指标系数,计算关联字段的可信度;对关联字段的可信度进行抽样,与真实数据交叉验证,优化后生成可信度最高的落地数据表。在大数据处理体系中,本方案通过综合各类数据、进行特征选择,建立可信度评分模型,对获取的原始数据进行关联可信度打分,为数据分析、应用提供数据可信程度的支撑和参考,提升数据分析、应用的效果。
-
公开(公告)号:CN115905294A
公开(公告)日:2023-04-04
申请号:CN202211707942.4
申请日:2022-12-29
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/242 , G06F16/2455
Abstract: 公开了基于可视化动态构建Flink SQL的方法和系统,包括将算子划分为源端算子、处理算子和目标算子,从数据源栏拖取源端算子到画板并配置算子信息;基于处理业务,在算子栏选择多个处理算子到画板中,并对算子的处理顺序进行编排;目标端栏中拖取相应的目标端算子到画板并配置算子信息。本申请的方法和系统只需在平台中拖取相应算子即可自动同时生成多个不同的复杂度SQL语句,SQL的正确性和便捷性都得到了提升,加快了数据治理实施人员在数据接入处理的速度。
-
公开(公告)号:CN115908941A
公开(公告)日:2023-04-04
申请号:CN202211603390.2
申请日:2022-12-13
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06V10/764 , G06V10/762 , G06V10/82 , G06N3/08
Abstract: 本发明提出了一种神经网络图片分类任务训练样本降采样方法,该方法包括如下步骤:采集并获取样本数据信息;基于获取的所述样本数据信息训练神经网络模型;在推理阶段,对样本数据进行预设的操作处理,进一步获得降采样样本数据;完成样本数据分类训练任务。通过降采样方法,确保了样本之间的分布多样性的同时,兼顾了对模型训练的增益效果,可以有效缓解样本标签不均衡的图片分类任务中,模型对少量样本类别的欠拟合问题。
-
-