一种机器学习数据增强方法
    9.
    发明公开

    公开(公告)号:CN115204296A

    公开(公告)日:2022-10-18

    申请号:CN202210844477.2

    申请日:2022-07-18

    Abstract: 本申请提供一种机器学习数据增强方法,步骤包括:设置训练集样本的特征中,使样本能够被正确预测的特征为已增强特征,导致样本被预测错误的特征为待增强特征,通过特征识别方法获得训练集样本的待增强特征;将具有待增强特征的样本设置为增强样本,从数据集中获得增强样本,将获得的增强样本加入训练集;将增强样本加入训练集后,重新对训练集进行训练与测试,直到在验证集上的分类性能达到最优。本申请增加了样本特征多样性,提高了分类准确度。

    提取动态网页信息的方法、装置及计算机可读存储介质

    公开(公告)号:CN112035722A

    公开(公告)日:2020-12-04

    申请号:CN202010771233.7

    申请日:2020-08-04

    Inventor: 董颖 卞超轶

    Abstract: 本发明实施例公开了一种提取动态网页信息的方法、装置及计算机可读存储介质,其中该方法,包括:确定动态网页上每个第一标签的访问路径;访问所述动态页面的种子页,进行信息提取;针对每个第一标签分别执行第一操作,所述第一操作包括:根据该第一标签的访问路径访问该第一标签以触发页面变化,对变化后的页面进行信息提取;其中,第一标签是指会触发页面变化的标签,每个第一标签的访问路径是指在所述动态网页的种子页到该第一标签之间的每层页面上需要访问的标签的索引序列组成的索引序列组合,所述动态网页的种子页是指该动态网页统一资源定位符URL对应的首页面。如此,能够实现对动态网页中功能不同但URL相同的页面进行信息提取。

Patent Agency Ranking