基于并行结构的网页web组件识别方法及装置

    公开(公告)号:CN116127236B

    公开(公告)日:2023-07-21

    申请号:CN202310419786.X

    申请日:2023-04-19

    Abstract: 本发明提供一种基于并行结构的网页web组件识别方法及装置,属于计算机技术领域,该方法包括:获取待识别的web响应信息;将所述web响应信息进行特征转换,得到特征向量;基于所述特征向量和识别模型,确定所述web响应信息包括的web组件;其中,识别模型包括多个子模型,模型训练数据包括web响应信息和多个组件类型的标签信息,每个所述子模型为基于web响应信息和每个所述子模型对应的组件类型的标签信息进行训练得到的,所述标签信息为web组件信息。

    基于并行结构的网页web组件识别方法及装置

    公开(公告)号:CN116127236A

    公开(公告)日:2023-05-16

    申请号:CN202310419786.X

    申请日:2023-04-19

    Abstract: 本发明提供一种基于并行结构的网页web组件识别方法及装置,属于计算机技术领域,该方法包括:获取待识别的web响应信息;将所述web响应信息进行特征转换,得到特征向量;基于所述特征向量和识别模型,确定所述web响应信息包括的web组件;其中,识别模型包括多个子模型,模型训练数据包括web响应信息和多个组件类型的标签信息,每个所述子模型为基于web响应信息和每个所述子模型对应的组件类型的标签信息进行训练得到的,所述标签信息为web组件信息。

Patent Agency Ranking