数据处理方法以及相关设备
    1.
    发明公开

    公开(公告)号:CN116795808A

    公开(公告)日:2023-09-22

    申请号:CN202310913228.9

    申请日:2023-07-24

    Abstract: 本申请实施例公开了数据处理方法以及相关设备,用于在降低计算成本的同时,保证特征计算的准确率以及压缩率。本申请实施例方法包括:确定每个数据块对应的多个第一特征值,每个第一特征值表示数据块包含的部分数据内容的特征;根据每个第一特征值所对应部分数据内容,将每个数据块对应的多个第一特征值划分为多组内容分簇,每个数据块对应的内容分簇数量等于预设特征数量;对每个第一特征值执行一次线性变换操作,获得每个第一特征值对应的第二特征值;将每个内容分簇对应的取值最小的第二特征值确定为每个内容分簇所对应数据块的目标特征值;根据每个数据块对应的多个目标特征值,确定每个数据块对应的相似数据块。

Patent Agency Ranking