一种针对海量文本数据的定向筛选装置及方法

    公开(公告)号:CN113742478B

    公开(公告)日:2023-09-05

    申请号:CN202010474192.5

    申请日:2020-05-29

    Abstract: 本发明公开了一种针对海量文本数据的定向筛选架构及方法。本方法步骤包括:1)使用关键词匹配方法从待筛选文本中获取疑似目标文本;2)从已标注的目标文本中提取常用句式,并分为与业务强相关句式、与业务弱相关句式;对待筛选文本进行模糊句式匹配,如果与业务强相关句式匹配,则将文本判断为目标文本,否则为疑似目标文本;3)对每一疑似目标文本进行分类;4)根据疑似目标文本匹配上的关键词的个数确定文本的评估值E1;根据分类判别结果,确定文本的评估值E2;基于文本与外部辅助语料的信息匹配结果确定文本的评估值E3;然后基于评估值E1~E3,计算得到文本最终评分反馈给研判层;5)研判层确定反馈的文本是否为目标文本。

    一种兼容4G和5G网络的防范诈骗电话的系统与方法

    公开(公告)号:CN110719592B

    公开(公告)日:2023-01-31

    申请号:CN201910992033.1

    申请日:2019-10-18

    Abstract: 一种兼容4G和5G网络的防范诈骗电话的系统与方法,包括:业务管理装置,将通话检测策略数据下发给汇聚装置,并接收汇聚装置上传的呼叫数据;汇聚装置,根据通话检测策略数据,从样本数据中提取特征信息,并加密,再将加密后的通话检测策略数据和特征信息发给各个前端接入装置;同时,将各个前端接入装置发来的呼叫数据还原后回传给业务管理装置;前端接入装置,根据收到的通话检测策略数据,对触发至核心网元的呼叫进行信令的实时解析,并将符合通话检测策略的呼叫数据回传给汇聚装置。本发明属于信息技术领域,能构建一套兼容4G并适配5G分组化、扁平化网络下的诈骗电话防范网络,保障不断演进的电信网络架构下的通信安全。

    一种网络公害文本识别方法及装置

    公开(公告)号:CN115617962A

    公开(公告)日:2023-01-17

    申请号:CN202110806921.7

    申请日:2021-07-16

    Abstract: 本发明提供一种网络公害文本识别方法及装置,包括:通过提取目标网络文本中的网址链接,对目标网络文本进行初步判定;若无法判定,则计算无效信息度,并生成目标网络文本的拼音列表、关键词列表、及关键词拼音列表;通过各关键词的字元素在目标网络文本中的分布及关键词拼音在目标网络文本拼音列表中的分布,计算各关键词的网络公害分;基于无效信息度对网络公害分进行修订,并根据修订结果,得到网络公害文本识别结果。本发明通过网络公害关键词字符和拼音的模糊匹配,可以准确识别出网络公害文本,同时可以有效应对目标文本中网络公害词被分割、倒序、文字竖排、谐音字等信息隐藏手段。

    有害音频识别解码方法及装置

    公开(公告)号:CN112466281A

    公开(公告)日:2021-03-09

    申请号:CN202011092988.0

    申请日:2020-10-13

    Abstract: 本发明公开了有害音频识别解码方法及装置,该方法包括:获取待识别音频数据,提取待测音频中的声学特征,对所述声学特征进行有效音频检测得到有效音频段;将所述有效音频段输入到有害音频分类网络模型,从文本意图的角度对待测样本进行分类,输出文本集合分类结果;将所述文本集合分类结果输入声学模型中输出解码结果。本发明通过对声学特征进行有效音频检测得到有效音频段;将所述有效音频段输入到有害音频分类网络模型,从文本意图的角度对待测样本进行分类,输出文本集合分类结果;将所述文本集合分类结果输入声学模型中输出解码结果,通过构建元学习的目标函数,获取大数据量的意图分类网络参数更新过程,提高有害音频识别解码的准确率。

Patent Agency Ranking