-
公开(公告)号:CN108777674B
公开(公告)日:2021-02-26
申请号:CN201810373630.1
申请日:2018-04-24
Applicant: 东南大学
IPC: H04L29/06 , H04L12/24 , G06F16/955
Abstract: 本发明公开了一种基于多特征融合的钓鱼网站检测方法,该方法能够实时检测互联网上的钓鱼网站。本发明首先根据网页的URL提取URL特征、HTML特征和基于TF‑IDF的文本向量;然后利用Logistic回归(Logistic regression)对文本向量进行分类,构建Logistic回归特征,并与网页URL特征和HTML特征进行多特征融合;最后训练XGBoost(eXtreme gradient boosting)模型,对待测钓鱼网站进行分类预测。本发明在网站的URL基础上,从多个维度全方位提取多关键特征,采用Logistic回归特征融合方法,有效解决文本向量特征维度过高问题,比现有特征融合方法能大幅提高运行效率,而且XGBoost分类模型比传统分类模型,更能提高钓鱼网站检测准确率,减少钓鱼网站检测漏报率。
-
公开(公告)号:CN107682416B
公开(公告)日:2020-05-19
申请号:CN201710851632.2
申请日:2017-09-19
Applicant: 东南大学
IPC: H04L29/08
Abstract: 本发明公开了一种基于播存网络的雾计算架构内容协同分发方法及应用系统。本发明利用播存网络来提升传统雾计算架构的内容主动推送能力和减少其对互联网带宽的消耗,采用软件定义网络SDN的集中控制思想,提出兼顾广播内容和Web缓存内容的多粒度协同存储机制;在此基础上,通过控制器来集中维护和控制域内所有结点,并为域内雾服务器制定高效的内容转发策略;最后,通过控制器来实现域内多结点的内容协同分发。本发明可以有效增强雾计算架构的内容主动推送能力,减少用户请求时延,提升用户体验。
-
公开(公告)号:CN108777674A
公开(公告)日:2018-11-09
申请号:CN201810373630.1
申请日:2018-04-24
Applicant: 东南大学
CPC classification number: H04L63/1483 , H04L41/147
Abstract: 本发明公开了一种基于多特征融合的钓鱼网站检测方法,该方法能够实时检测互联网上的钓鱼网站。本发明首先根据网页的URL提取URL特征、HTML特征和基于TF-IDF的文本向量;然后利用Logistic回归(Logistic regression)对文本向量进行分类,构建Logistic回归特征,并与网页URL特征和HTML特征进行多特征融合;最后训练XGBoost(eXtreme gradient boosting)模型,对待测钓鱼网站进行分类预测。本发明在网站的URL基础上,从多个维度全方位提取多关键特征,采用Logistic回归特征融合方法,有效解决文本向量特征维度过高问题,比现有特征融合方法能大幅提高运行效率,而且XGBoost分类模型比传统分类模型,更能提高钓鱼网站检测准确率,减少钓鱼网站检测漏报率。
-
公开(公告)号:CN106372180B
公开(公告)日:2017-08-25
申请号:CN201610785180.8
申请日:2016-08-30
Applicant: 东南大学
CPC classification number: H04L63/20 , G06F17/30 , G06F17/30876 , H04L63/08 , H04L67/1097
Abstract: 本发明公开了一种支持共享共治的内容元数据标识方法(简称MDCCSG方法)及应用方法,该标识方法针对大数据和泛媒体环境下的内容大数据共享共治需求提出,适用于对各种品类的内容资源进行统一标识,与之配套的应用方法可有效支持内容大数据的高效共享和科学治理等。MDCCSG方法包括三个部分:内容元数据的统一描述框架、内容元数据的统一规约方法、核心MDCCSG标识要素定义等,该标识方法既能详尽描述内容的丰富语义信息,又具有内嵌的(built‑in)内容可信认证与安全保障能力;基于MDCCSG标识可开发各种内容共享共治应用,能够有效支持内容大数据的高效聚合与分发、个性化主动服务、语义深度分析、认证注册管理、依法溯源追责等。
-
公开(公告)号:CN109101552B
公开(公告)日:2022-01-28
申请号:CN201810750707.2
申请日:2018-07-10
Applicant: 东南大学
IPC: G06F16/955 , G06N3/04
Abstract: 本发明公开了一种基于深度学习的钓鱼网站URL检测方法,该方法仅根据网站URL就能够实时检测互联网上的钓鱼网站。本发明首先将URL字符串序列编码成one‑hot二维稀疏矩阵,接着转化为稠密字符嵌入矩阵,输入到卷积神经网络中,抽取局部深度特征,然后将卷积神经网络的输出输入到长短期记忆网络,捕获URL序列的前后关联,最后接入softmax模型,对URL分类。本发明能避免繁冗的特征工程,通过卷积神经网络抽取局部深度关联性特征,通过长短期记忆网络学习URL中的长程依赖,能快速、准确地检测出钓鱼网站URL。
-
公开(公告)号:CN108390764B
公开(公告)日:2020-07-31
申请号:CN201810002696.X
申请日:2018-01-02
Applicant: 东南大学
IPC: H04L12/18 , H04L12/865 , H04L1/00
Abstract: 本发明公开了一种面向播存网络的广播内容补包方法及系统,利用32位循环冗余检验法对接收的广播数据包进行检错,然后提取出错内容的类别、热度、内容指纹等相关参数,并利用服从指数分布的补包概率模型计算补包概率,以此概率值为依据对出错内容进行筛选和优先级评估,最后利用一个优先级队列对出错数据包进行有序补包。本发明能在保证数据包正确补回的基础上,充分兼顾播存网络的个性化特色和资源利用率,并能通过改变补包阈值灵活调节补包强度,增强播存网络的内容广播分发性能。
-
公开(公告)号:CN109101478A
公开(公告)日:2018-12-28
申请号:CN201810564582.4
申请日:2018-06-04
Applicant: 东南大学
Abstract: 本发明公开了一种面向电商评论文本的Aspect级情感分析方法。首先,对电商评论文本进行预处理,并按照其所属的商品、商家、品牌进行分批;接着,在一批电商评论文本内部,综合考虑词性、句法及共现性特征,对候选评价对象的重要性进行排序,抽取电商评论文本中的评价对象;然后,利用动态滑动窗口机制将词项间共现限定在评论段级,并基于LDA模型对这一批电商评论文本中的评价对象进行聚类,得到评论Aspect-评价对象间对应关系;最后,基于构建的情感词典、否定词典,对电商评论文本进行情感分析。本发明不仅可以挖掘电商评论文本中的评价对象,给出细粒度的评价对象级情感分析结果;还能充分利用具体商品、商家、品牌范围内评价对象间的主题相关性,对评价对象进行聚类,进而得到评论Aspect级情感分析结果。
-
-
-
-
-
-