一种基于改进的主动学习技术的电信欺诈分类检测方法

    公开(公告)号:CN109492026B

    公开(公告)日:2021-11-09

    申请号:CN201811301410.4

    申请日:2018-11-02

    Abstract: 本发明公开了一种基于改进的主动学习技术的电信欺诈分类检测方法,涉及一种基于改进的主动学习技术的电信欺诈分类检测方法。抽取数量为X的数据划分训练集和测试集。从训练集中抽取样本作为初始训练集,其余为未标记样本。若当前训练集中正类与负类样本数量的比值不小于阈值e,训练有监督分类器f并构造强组合分类器F;将未标记样本逐个放入有监督分类器f中进行类别评分,得到类别评分结果,输入主动学习采样算法,得到信息量大小的评分。选取信息量最大的前D个进行标注,并加入训练集中;当前训练集样本数量大于等于X1,或者迭代次数大于等于C时结束,输出训练好的分类器f。本发明具有较强的稳定性和鲁棒性,实现较高的分类和检测效率。

    一种基于滑动时间窗口聚合的电信诈骗电话的序列异常检测方法

    公开(公告)号:CN109587350B

    公开(公告)日:2021-06-22

    申请号:CN201811373658.1

    申请日:2018-11-16

    Abstract: 本发明公开了一种基于滑动时间窗口聚合的电信诈骗电话的序列异常检测方法,属于数据挖掘与机器学习和商务智能领域。首先构造训练用户数据集,回溯被叫用户全部通话记录,形成各被叫用户通话序列。利用cos相似度函数,计算序列结构相似度和统计特征相似度并进行线性组合,得到加和相似度。然后通过K‑Means聚类模型得到K类用户,构成独立的序列训练数据集,通过滑动时间窗口,形成K个训练集。最后在每个训练集上训练iForest模型,得到K个异常检测模型。每个被叫用户通过对应的异常检测模型识别异常,当最大值高于阈值h时,该被叫用户是高风险的被叫用户。每过固定时间段更新K‑Means模型和异常检测模型。本发明缓解了数据稀疏性问题,发现基于群组的异常特征。

    有害音频识别解码方法及装置

    公开(公告)号:CN112466281A

    公开(公告)日:2021-03-09

    申请号:CN202011092988.0

    申请日:2020-10-13

    Abstract: 本发明公开了有害音频识别解码方法及装置,该方法包括:获取待识别音频数据,提取待测音频中的声学特征,对所述声学特征进行有效音频检测得到有效音频段;将所述有效音频段输入到有害音频分类网络模型,从文本意图的角度对待测样本进行分类,输出文本集合分类结果;将所述文本集合分类结果输入声学模型中输出解码结果。本发明通过对声学特征进行有效音频检测得到有效音频段;将所述有效音频段输入到有害音频分类网络模型,从文本意图的角度对待测样本进行分类,输出文本集合分类结果;将所述文本集合分类结果输入声学模型中输出解码结果,通过构建元学习的目标函数,获取大数据量的意图分类网络参数更新过程,提高有害音频识别解码的准确率。

    一种基于图嵌入的诈骗号码识别方法

    公开(公告)号:CN110177179B

    公开(公告)日:2020-12-29

    申请号:CN201910410802.2

    申请日:2019-05-16

    Abstract: 一种基于图嵌入的诈骗号码识别方法,包括:基于用户在一段时间内的通话信令,计算用户的通话特征指标,并构成每个用户的通话特征指标向量,同时,提取和用户在一段时间内存在通话关系的联系人作为用户的直接邻居,构成每个用户的直接邻居组;构建、并训练识别诈骗号码的图嵌入神经网络,其输入是目标用户和多个关联用户的通话特征指标向量,输出是标识目标用户号码是否是疑似诈骗号码的标签信息;将待识别的目标用户和多个关联用户的通话特征指标向量输入训练后的图嵌入神经网络,然后根据输出判断待识别的目标用户号码是否是疑似诈骗号码。本发明属于信息技术领域,能基于诈骗电话“多点—点”的通联关系结构模式来实现诈骗号码的精准识别。

    电信网络诈骗事件的剧本提取方法以及装置

    公开(公告)号:CN111858925A

    公开(公告)日:2020-10-30

    申请号:CN202010501138.5

    申请日:2020-06-04

    Abstract: 本发明公开了电信网络诈骗事件的剧本提取方法、装置、电子设备以及存储介质。该方法包括:获取已知主题类别的电信网络诈骗事件文本;对文本进行分句操作;提取文本中各单句的关键词;利用预先建立的BERT模型提取已知主题类别的电信网络诈骗事件文本中各单句的关键词向量;基于任意两个具有相邻句序的单句的关键词向量的均值向量之间的空间距离,对两个具有相邻句序的单句进行剧情阶段的划分;获取各阶段所包含的单句的关键词作为所属的主题类别下电信网络诈骗事件中各阶段的情节特征的表示。本发明实现了对于电信网络诈骗事件剧情阶段的划分,提取出有助于识别电信网络诈骗事件的特征,从而达到精准提取电信网络诈骗事件剧本的目的。

Patent Agency Ranking