一种基于动态采样的不平衡图片数据分类方法和装置

    公开(公告)号:CN116310498A

    公开(公告)日:2023-06-23

    申请号:CN202310060451.3

    申请日:2023-01-18

    Abstract: 本申请涉及一种基于动态采样的不平衡图片数据分类方法和装置,所述方法包括S1:手动创建不平衡图像数据;S2:对创建的不平衡图像数据进行归一化和独热编码,获得训练样本;S3:构建图片分类基础模型并冻结住模型;S4:利用f1‑score算法来动态的进行训练样本的采样;S5:解冻模型并利用f1‑score动态采样过的数据开始训练,然后根据混淆矩阵来输出损失结果和每个类型图像识别的准确率。本申请在训练过程之前会生成一个新的数据集来实现离线数据增强。生成的数据集足够大,可以保证有足够的样本在训练阶段对F1分数低的类进行重采样。与在线数据增强相比,离线数据增强具有易于阅读、方便后期实施调整以及生成可视化图像有助于控制增强图像等优点。

    一种基于特征继承的实体关系抽取方法、装置及存储介质

    公开(公告)号:CN115794986A

    公开(公告)日:2023-03-14

    申请号:CN202211615674.3

    申请日:2022-12-15

    Abstract: 本申请涉及一种基于特征继承的实体关系抽取方法,其包括:S1:对输入文本进行实体抽取,获得实体的有效特征,所述实体的有效特征包括实体、实体类型以及实体在原文本中的位置;S2:对输入文本进行词性分析,得到句子的词性结果;S3:根据获得的实体的有效特征和词性结果构建三元组特征;S4:将三元组特征输入关系分类网络中,并输出分类结果。本申请提出了一种基于特征继承的实体关系抽取方法,该方法将第一阶段的其他有效特征也传递到第二阶段,因为这些特征都准确率高,所以这样的特征会大大增强了第二阶段关系分类的效果。然后将这些特征通过带有注意力机制的网络层进行各类特征的权重学习,可以有效提升关系抽取效果。

Patent Agency Ranking