网页中的列表提取和可视化
    1.
    发明公开

    公开(公告)号:CN116484126A

    公开(公告)日:2023-07-25

    申请号:CN202210040984.0

    申请日:2022-01-14

    Abstract: 本公开提供了用于网页中的列表提取和可视化的方法、装置和计算机程序产品。可以检测目标网页中的至少一个锚点元素组,所述至少一个锚点元素组包括第一锚点元素组。可以对所述第一锚点元素组中的多个锚点元素执行边界检测,以获得与所述多个锚点元素分别关联的多个项目的边界,所述多个项目对应于所述目标网页中的第一原始列表。可以利用所述多个项目的边界,从所述目标网页中获得与所述多个项目分别对应的多组代表性元数据。可以将所述多组代表性元数据可视化为结构化列表。

Patent Agency Ranking