-
公开(公告)号:CN111601314A
公开(公告)日:2020-08-28
申请号:CN202010457020.7
申请日:2020-05-27
Applicant: 北京亚鸿世纪科技发展有限公司 , 国家计算机网络与信息安全管理中心安徽分中心
IPC: H04W12/12 , H04W4/14 , G06K9/62 , G06F16/955 , G06F16/951 , G06F16/35
Abstract: 预训练模型加短信地址双重判定不良短信的方法和装置涉及信息技术领域。本发明由已分类短信样品集、预训练模型模块、短信采集器、文本处理器、地址提取器、网络爬虫和不良短信判断器组成;实现本发明解决传统机器学习在不良短信识别中对特征的依赖,与深度学习相比,不仅不需要大量的训练集,而且可以通过短信中的url短链接进行判断,使得语义信息稀疏的短信得到很好的识别;同时结合文本信息和短信地址来判断短信的性质比仅依据短信地址的ip判断短信的性质拥有更好的解释性和更直观的分析效果。
-
公开(公告)号:CN111601314B
公开(公告)日:2023-04-28
申请号:CN202010457020.7
申请日:2020-05-27
Applicant: 北京亚鸿世纪科技发展有限公司 , 国家计算机网络与信息安全管理中心安徽分中心
IPC: G06F16/35 , G06F16/951
Abstract: 预训练模型加短信地址双重判定不良短信的方法和装置涉及信息技术领域。本发明由已分类短信样品集、预训练模型模块、短信采集器、文本处理器、地址提取器、网络爬虫和不良短信判断器组成;实现本发明解决传统机器学习在不良短信识别中对特征的依赖,与深度学习相比,不仅不需要大量的训练集,而且可以通过短信中的url短链接进行判断,使得语义信息稀疏的短信得到很好的识别;同时结合文本信息和短信地址来判断短信的性质比仅依据短信地址的ip判断短信的性质拥有更好的解释性和更直观的分析效果。
-
公开(公告)号:CN110580287A
公开(公告)日:2019-12-17
申请号:CN201910765809.6
申请日:2019-08-20
Applicant: 北京亚鸿世纪科技发展有限公司
Abstract: 基于迁移学习和ON-LSTM的情感分类方法涉及信息技术领域。本发明包括:Bert模型预训练步骤,网络获取情感语料处理步骤,获取干净的情感语料向量步骤,用ON-LSTM神经网络生产干净的情感语料的情感标签步骤。本发明能不受词典的制约,可以得到更多、更精准的情感特征用于分类器分类;与一般的基于机器学习的情感分类算法比较,不需要海量的标注情感语料,其次ON-LSTM模型的结构特点决定了模型能在提取情感语料的词向量特征的基础上提取情感语料的句法结构,大幅度地提高了情感语料分类的准确率。
-
-