一种针对海量文本数据的定向筛选装置及方法

    公开(公告)号:CN113742478B

    公开(公告)日:2023-09-05

    申请号:CN202010474192.5

    申请日:2020-05-29

    Abstract: 本发明公开了一种针对海量文本数据的定向筛选架构及方法。本方法步骤包括:1)使用关键词匹配方法从待筛选文本中获取疑似目标文本;2)从已标注的目标文本中提取常用句式,并分为与业务强相关句式、与业务弱相关句式;对待筛选文本进行模糊句式匹配,如果与业务强相关句式匹配,则将文本判断为目标文本,否则为疑似目标文本;3)对每一疑似目标文本进行分类;4)根据疑似目标文本匹配上的关键词的个数确定文本的评估值E1;根据分类判别结果,确定文本的评估值E2;基于文本与外部辅助语料的信息匹配结果确定文本的评估值E3;然后基于评估值E1~E3,计算得到文本最终评分反馈给研判层;5)研判层确定反馈的文本是否为目标文本。

    一种兼容4G和5G网络的防范诈骗电话的系统与方法

    公开(公告)号:CN110719592B

    公开(公告)日:2023-01-31

    申请号:CN201910992033.1

    申请日:2019-10-18

    Abstract: 一种兼容4G和5G网络的防范诈骗电话的系统与方法,包括:业务管理装置,将通话检测策略数据下发给汇聚装置,并接收汇聚装置上传的呼叫数据;汇聚装置,根据通话检测策略数据,从样本数据中提取特征信息,并加密,再将加密后的通话检测策略数据和特征信息发给各个前端接入装置;同时,将各个前端接入装置发来的呼叫数据还原后回传给业务管理装置;前端接入装置,根据收到的通话检测策略数据,对触发至核心网元的呼叫进行信令的实时解析,并将符合通话检测策略的呼叫数据回传给汇聚装置。本发明属于信息技术领域,能构建一套兼容4G并适配5G分组化、扁平化网络下的诈骗电话防范网络,保障不断演进的电信网络架构下的通信安全。

    一种网络公害文本识别方法及装置

    公开(公告)号:CN115617962A

    公开(公告)日:2023-01-17

    申请号:CN202110806921.7

    申请日:2021-07-16

    Abstract: 本发明提供一种网络公害文本识别方法及装置,包括:通过提取目标网络文本中的网址链接,对目标网络文本进行初步判定;若无法判定,则计算无效信息度,并生成目标网络文本的拼音列表、关键词列表、及关键词拼音列表;通过各关键词的字元素在目标网络文本中的分布及关键词拼音在目标网络文本拼音列表中的分布,计算各关键词的网络公害分;基于无效信息度对网络公害分进行修订,并根据修订结果,得到网络公害文本识别结果。本发明通过网络公害关键词字符和拼音的模糊匹配,可以准确识别出网络公害文本,同时可以有效应对目标文本中网络公害词被分割、倒序、文字竖排、谐音字等信息隐藏手段。

    分类精度评价方法、装置、计算机设备和存储介质

    公开(公告)号:CN113052270A

    公开(公告)日:2021-06-29

    申请号:CN202110503779.9

    申请日:2021-05-10

    Abstract: 本申请涉及一种分类精度评价方法、装置、计算机设备和存储介质。所述方法包括:获取有害语音样本集;将有害语音样本集中的每个有害语音样本输入待评价的有害语音分类模型中进行分类,得到预测类别标签;在预设的分类层级中,确定与预测类别标签和有害语音样本的样本类别标签对应的目标分类;根据目标分类计算待评价的有害语音分类模型的分类精确程度。本方案中,对有害语音样本进行了多层次的分类(即分类层级),然后在分类层级中确定预测类别标签和样本类别标签共同所属的目标分类,目标分类可以反映预测类别标签和样本类别标签的匹配度,进而根据目标分类确定分类模型的分类精确程度,能够有效的提高分类模型评价的准确度。

Patent Agency Ranking