语言模型的训练方法、NLP任务处理方法及装置

    公开(公告)号:CN113420123A

    公开(公告)日:2021-09-21

    申请号:CN202110705729.9

    申请日:2021-06-24

    Abstract: 本申请提供了一种语言模型的训练方法、NLP任务处理方法及装置,包括:获取训练样本集;训练样本集包括新任务的第一任务标签、新任务的多个第一训练文本和每个第一训练文本的第一文本标签、至少一个旧任务中每个旧任务的第二任务标签;复制语言模型得到教师语言模型,将语言模型作为学生语言模型;将第二任务标签输入至教师语言模型中,生成旧任务对应的多个第二训练文本和每个第二训练文本的第二文本标签;将第一任务标签、第二任务标签、第一训练文本和第二训练文本输入至学生语言模型中,生成第一预测文本、第一预测结果、第二预测文本和第二预测结果,对学生语言模型进行训练。根据本申请实施例,能够解决相关技术中存储资源占用大的问题。

    一种大规模数据流中电信欺诈风险识别方法

    公开(公告)号:CN109274836B

    公开(公告)日:2021-06-15

    申请号:CN201811287123.2

    申请日:2018-10-31

    Abstract: 本发明公开了一种大规模数据流中电信欺诈风险识别方法,属于数据挖掘与机器学习和商务智能等领域。从呼叫记录数据库中筛选高风险被叫用户和主叫用户作为分析对象,构建欺诈被叫索引数据库,提取各个索引对应的显著特征;采用二级级联分类模型,得到每个被叫号码的攻击风险值;保留每个高风险被叫号码最近的滑动窗口异常得分的最大值,作为各自的序列风险值;构造被叫号码与主叫号码的通联关系二部图,计算每个被叫号码的通联风险值;借助逻辑回归模型,对每个被叫号码的攻击风险、序列风险和通联风险进行融合,得出每个被叫号码各自的综合风险值。本发明最终的综合风险值具有较高的稳定性和可解释性,实现较高的分类和检测效率。

    基于无监督学习的诈骗呼叫序列检测方法

    公开(公告)号:CN110059889B

    公开(公告)日:2021-05-28

    申请号:CN201910344174.2

    申请日:2019-04-26

    Abstract: 本发明提供了基于无监督学习的诈骗呼叫序列检测方法,包括:构造主叫呼叫序列和呼叫二部图;在呼叫二部图中进行随机游走过程,推断各主叫号码对应节点的低维嵌入表示向量;获取各被叫号码的唯一标识,以主叫号码对应节点的低维嵌入表示向量以及第M个被叫号码对应的唯一标识为神经网络的输入,以第M+1个被叫号码对应的唯一标识为输出,训练获得神经网络预测模型;获取待检测主叫呼叫序列中主叫号码对应节点的低维嵌入表示向量以及各被叫号码对应的唯一标识,并输入所述神经网络预测模型,若得到的预测唯一标识与实际唯一标识的误差大于设定阈值,则判断主叫号码为诈骗号码。本发明中提出的方法容易实现并行化计算,可以实现较高的检测效率。

    一种采用流表方式实现的呼叫管理的系统及其方法

    公开(公告)号:CN110856176A

    公开(公告)日:2020-02-28

    申请号:CN201910992035.0

    申请日:2019-10-18

    Abstract: 一种采用流表方式实现的呼叫管理的系统及其方法,包括:前端接入装置,安装在IMS网络的业务服务器上,定期以流表方式上报服务器的能力数据到后端控制器,并接收后端控制器下发的流表策略数据;当接收到CSCF的呼叫信令时,根据流表策略数据,对服务器接收的呼叫信令进行检测和匹配,记录处置结果,然后将呼叫过程中的数据回传给后端控制器;后端控制器,接收并更新前端接入装置上报的流表数据,然后根据前端接入装置上报的能力数据,生成对应的流表策略数据,再将所述流表策略数据下发给前端接入装置;同时,接收并保存前端接入装置发来的呼叫过程数据。本发明属于信息技术领域,能基于各省移动网络运营商侧来构建共同的呼叫管理网络。

Patent Agency Ranking