一种诈骗文本命名实体识别方法及系统

    公开(公告)号:CN113642328A

    公开(公告)日:2021-11-12

    申请号:CN202010343089.7

    申请日:2020-04-27

    Abstract: 本发明提出一种诈骗文本命名实体识别方法,包括:收集诈骗文本,对诈骗文本进行类别标记;使用诈骗文本和类别标记过的诈骗文本进行诈骗文本模型训练,生成诈骗文本命名实体判断模型;接收新通信文本,使用诈骗文本命名实体判断模型对新通信文本进行分析,获取新通信文本中的命名实体及类别。本发明针对诈骗文本手段不断变化,收集大量的历史诈骗文本,构建诈骗文本命名实体判断模型,周期性收集多条历史诈骗文本的相关数据对诈骗文本命名实体判断模型进行自回溯验证,对新通讯文本命名实体识别进行实时验证,实现系统自动化分析处理与人工校准相结合,有效识别新型诈骗文本中的命名实体,通过自动验证不断完善系统模型,实现系统自动化。

    一种基于关键词特征嵌入语言模型的意图识别方法及系统

    公开(公告)号:CN112989839A

    公开(公告)日:2021-06-18

    申请号:CN201911309397.1

    申请日:2019-12-18

    Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于关键词特征嵌入语言模型的意图识别方法,包括:采用前后向最大分词算法,对提取的有效文本的语言信息进行分词,获得不同类别的分词结果;针对获得的不同类别的分词结果,获得不同类别的分词结果对应的候选意图相关的关键词列表;剔除每一种类别的分词结果对应的候选意图相关的关键词列表中的通用高频词和领域无关词,获得每一种类别的分词结果对应的最终关键词表,进而获得不同的关键词特征向量;将获得的每一个关键词特征向量嵌入至预先训练好的语言模型,获得带有关键词特征的有效文本的语音信息;并对其进行编码和分类,获得该有效文本的语言信息的意图识别结果。

    一种基于时空图的诈骗号码识别方法

    公开(公告)号:CN111726460B

    公开(公告)日:2021-04-20

    申请号:CN202010542365.2

    申请日:2020-06-15

    Abstract: 一种基于时空图的诈骗号码识别方法,包括:由全量通话记录生成电信通联网络,并构建识别诈骗号码的时空图,使用Snapshot方法按时间间隔T、从图中连续截取出多张时空子图;基于用户在每张时空子图对应时间周期下的通话记录,计算每个用户在每张时空子图对应时间周期下的通话特征指标向量,同时,为每个用户从时空子图中提取和其有相同被叫的邻居用户;构建、并训练识别诈骗号码的时空图神经网络;将待识别目标用户和其所有邻居用户在所有时空子图中的通话特征指标向量输入时空图神经网络,并根据输出判断待识别目标用户号码是否是疑似诈骗号码。本发明属于信息技术领域,能动态的捕获到号码呼叫行为的变化,从而实现诈骗号码的精准识别。

Patent Agency Ranking