用于处理数据的方法、装置、设备、介质和程序产品

    公开(公告)号:CN119599145A

    公开(公告)日:2025-03-11

    申请号:CN202411647783.2

    申请日:2024-11-15

    Inventor: 童泳淇 张鑫

    Abstract: 本公开的实施例涉及用于处理数据的方法、装置、设备、介质和程序产品。该方法包括获取用于训练机器学习模型的原始数据集,原始数据集包括可用作机器学习模型的输入的第一多个提示。该方法还包括将第一多个提示划分为多个提示组,来自同一提示组的两个提示之间的相似度大于来自不同提示组中的两个提示之间的相似度。该方法还包括确定多个提示组中的提示组中的第二多个提示到提示组的中心点的多个距离。该方法还包括基于多个距离,从提示组中选择部分提示以用于调整机器学习模型。通过该方法,从原始数据集的多个提示中选择有代表性的提示来进行模型的调整,有效地减少了知识广度,并且减少了计算资源的使用,提高了数据处理效率和用户体验。

    木马流量检测方法及装置、电子设备、存储介质

    公开(公告)号:CN116436669A

    公开(公告)日:2023-07-14

    申请号:CN202310391030.9

    申请日:2023-04-06

    Inventor: 张鑫 吴登辉

    Abstract: 本说明书一个或多个实施例提供一种木马流量检测方法及装置、电子设备、存储介质。该方法包括:将网络流量数据中同一域名的数据包进行合并处理,得到候选数据包序列;根据所述候选数据包序列中各个数据包的时间戳,获取所述域名对应的时间间隔序列;响应于所述时间间隔序列满足预设条件,将所述时间间隔序列对应的候选数据包序列确定为心跳流量序列;所述预设条件用于刻画心跳周期的随机性;对所述心跳流量序列进行筛选处理,得到所述网络流量数据中的木马流量。这样,本实施例可以解决固定IP地址无法适用隐蔽信道场景的问题;并且,可以更好地捕捉到存在心跳抖动的心跳数据包,达到准确发现木马流量的效果。

Patent Agency Ranking