一种诈骗文本命名实体识别方法及系统

    公开(公告)号:CN113642328A

    公开(公告)日:2021-11-12

    申请号:CN202010343089.7

    申请日:2020-04-27

    Abstract: 本发明提出一种诈骗文本命名实体识别方法,包括:收集诈骗文本,对诈骗文本进行类别标记;使用诈骗文本和类别标记过的诈骗文本进行诈骗文本模型训练,生成诈骗文本命名实体判断模型;接收新通信文本,使用诈骗文本命名实体判断模型对新通信文本进行分析,获取新通信文本中的命名实体及类别。本发明针对诈骗文本手段不断变化,收集大量的历史诈骗文本,构建诈骗文本命名实体判断模型,周期性收集多条历史诈骗文本的相关数据对诈骗文本命名实体判断模型进行自回溯验证,对新通讯文本命名实体识别进行实时验证,实现系统自动化分析处理与人工校准相结合,有效识别新型诈骗文本中的命名实体,通过自动验证不断完善系统模型,实现系统自动化。

    一种网络诈骗易感人群筛选方法

    公开(公告)号:CN111737318A

    公开(公告)日:2020-10-02

    申请号:CN202010585668.2

    申请日:2020-06-24

    Abstract: 本发明提供一种网络诈骗易感人群筛选方法,包括:提取高危用户的社会属性数据;根据高危用户的社会属性进行分段,统计每个属性分段的访问诈骗网站人数;根据高危用户在各个属性分段的数量分布,为每个属性分段分配不同的权重,形成权重集合;计算所有高危用户的权重的加权平均值,取加权平均值最小的用户作为筛选阈值;使用权重集合与筛选阈值建立初始模型。由于容易受害的群体往往集中在部分人群,针对这些人群重点宣传,可以起到事半功倍的效果,因此通过本发明可以准确、迅速的对诈骗网站的访问数据分析筛选,挖掘出网络诈骗易受害人群,从而提高防网络诈骗宣传的效率,针对易被骗人群重点宣传,有效降低诈骗率,降低宣传成本。

    一种基于多维时间序列的诈骗电话分析方法

    公开(公告)号:CN109756632A

    公开(公告)日:2019-05-14

    申请号:CN201811554685.9

    申请日:2018-12-19

    Abstract: 本发明公开了一种基于多维时间序列的诈骗电话分析方法,该方法包括:将每个号码的所有通话作为一个整体,每间隔时间段选取与诈骗呼叫相关性较大的行为特征,计算每个号码在该间隔时间段内的特征统计量,并设定是否为诈骗呼叫的标签;将每个号码在设定的间隔时间段的多个行为特征按时间顺序排列,整合形成在一个完整时间段内的一个多维时间序列数据集,多个号码形成多个多维时间序列数据集;将带标签的多个多维时间序列数据集,代入LSTM网络模型训练;根据某号码在该一个完整时间段的模型训练,预测该号码在该完整时间段的下一个间隔时间段时的通话呼叫是否为诈骗呼叫。通过本发明的方法,能够从众多的话单数据中分析预判是否为诈骗呼叫。

Patent Agency Ranking