一种多元流媒体数据采集方法
    4.
    发明公开

    公开(公告)号:CN116915756A

    公开(公告)日:2023-10-20

    申请号:CN202310845588.X

    申请日:2023-07-10

    Abstract: 本发明提供了一种多元流媒体数据采集方法,将多元流媒体,例如:内嵌在不同种类APP、PC客户端、HTML页面等视图数据进行源链接提取、特征提取、持久化存储,针对流媒体页面不同的反爬虫手段,获取视图数据,为后续视图内容识别分析做数据储备,方法包括:步骤1,获取待采集流媒体数据的流媒体源地址;步骤2,对流媒体源地址进行合规性验证;步骤3,对通过验证的流媒体源地址,进行分布式采集,得到流媒体数据;步骤4,对采集到的流媒体数据,进行流媒体特征信息提取;步骤5,根据流媒体特征信息,进行流媒体数据融合,得到结构化流媒体数据,完成所述的多元流媒体数据采集。

Patent Agency Ranking