一种基于深度强化学习模型的数据清洗方法及装置

    公开(公告)号:CN113326689A

    公开(公告)日:2021-08-31

    申请号:CN202010128327.2

    申请日:2020-02-28

    Abstract: 本发明属于数据通信和数据处理技术领域,具体涉及一种基于深度强化学习模型的数据清洗方法,该方法包括:获取待清洗的带标签的数据集;采用预筛选算法,删除待清洗的带标签的数据集中的无内容数据、不在标签集内的标签数据和标签矛盾的数据,获得待分类的数据集;将待分类的数据集输入至预先训练的深度强化学习模型中,获得不同类别的延迟奖励;再根据获得的不同类别的延迟奖励,依据预先训练的深度强化学习模型中的动作集合,丢弃掉有偏数据,保留有效数据,并更新状态列表S,最大化每一类别的延迟奖励值,将每一类别的最大延迟奖励值对应的带标签的训练数据集作为清洗干净的带标签的训练数据集,从而完成数据清洗。

    一种诈骗短信识别方法及识别系统

    公开(公告)号:CN110267272A

    公开(公告)日:2019-09-20

    申请号:CN201910572213.4

    申请日:2019-06-28

    Abstract: 本发明涉及一种诈骗短信识别方法及识别系统,该方法包括:收集多条历史诈骗短信的相关数据,并从每条历史诈骗短信的相关数据提取历史诈骗短信的特征向量和诈骗类别;根据历史诈骗短信的特征向量和诈骗类别进行诈骗短信模型训练,获取诈骗短信判断模型;接收新短信的相关数据,并从每条新短信的相关数据中提取新短信的特征向量;将新短信的特征向量输入诈骗短信判断模型中,获取新短信是否属于诈骗短信以及属于哪种诈骗类别。本发明收集并根据多条历史诈骗短信的相关数据获取诈骗短信判断模型,该诈骗短信判断模型基于历史诈骗短信的相关数据,不限于短信内容,使得诈骗短信判断模型能够从多方面综合判断新短信是否属于诈骗短信以及哪种诈骗短信。

    人脸匿名化方法和装置
    28.
    发明公开

    公开(公告)号:CN119863846A

    公开(公告)日:2025-04-22

    申请号:CN202411792800.1

    申请日:2024-12-07

    Abstract: 本发明提供了一种人脸匿名化方法,包括:筛选从视图数据中检出的人脸图像;从所述人脸图像中获取关键点的特征向量和高维嵌入的表征向量;构造与所述表征向量同维度的随机向量,将所述表征向量结合所述随机向量和为所述随机向量设定的噪声系数,计算扰动表征向量;将所述扰动表征向量和所述特征向量拼接后获得随机扰动后的人脸图像,以所述随机扰动后的人脸图像替换所述人脸图像。本发明有益效果:通过对人脸属性特征的的修改,不改变人脸基本状态的情况下就可以隐藏特定个人的属性特征信息,同时不会影响视觉效果。

    语音匿名化和装置
    29.
    发明公开

    公开(公告)号:CN119741919A

    公开(公告)日:2025-04-01

    申请号:CN202411802628.3

    申请日:2024-12-09

    Abstract: 本发明提供了一种语音匿名化方法,包括:将语音数据按照激活检测结果分割为语音数据片段,转写所述语音数据片段为文本序列;由敏感词列表和所述文本序列对比以获取敏感词,以敏感词替换符替换所述敏感词,生成脱敏文本片段;根据所述脱敏文本片段生成文本嵌入表征码,与随机声纹嵌入表征码拼接,生成拼接表征码;通过后向解码网络将所述拼接表征码解码为时频谱后,声码器将所述时频谱转化为音频波形。本发明有益效果:通过对语音声纹的修改和敏感词的提出,实现的在不改变语音数据属性的条件下,对语音数据脱敏和匿名化。

Patent Agency Ranking