-
公开(公告)号:CN108777674B
公开(公告)日:2021-02-26
申请号:CN201810373630.1
申请日:2018-04-24
Applicant: 东南大学
IPC: H04L29/06 , H04L12/24 , G06F16/955
Abstract: 本发明公开了一种基于多特征融合的钓鱼网站检测方法,该方法能够实时检测互联网上的钓鱼网站。本发明首先根据网页的URL提取URL特征、HTML特征和基于TF‑IDF的文本向量;然后利用Logistic回归(Logistic regression)对文本向量进行分类,构建Logistic回归特征,并与网页URL特征和HTML特征进行多特征融合;最后训练XGBoost(eXtreme gradient boosting)模型,对待测钓鱼网站进行分类预测。本发明在网站的URL基础上,从多个维度全方位提取多关键特征,采用Logistic回归特征融合方法,有效解决文本向量特征维度过高问题,比现有特征融合方法能大幅提高运行效率,而且XGBoost分类模型比传统分类模型,更能提高钓鱼网站检测准确率,减少钓鱼网站检测漏报率。
-
公开(公告)号:CN111538835A
公开(公告)日:2020-08-14
申请号:CN202010238006.8
申请日:2020-03-30
Applicant: 东南大学
IPC: G06F16/35 , G06F16/36 , G06F40/295 , G06N3/04
Abstract: 本发明公开了一种基于知识图谱的社交媒体情感分类方法与装置。首先基于构建基础知识图谱,并结合情感词典对基础知识图谱中的实体进行情感实体定位和情感极性标注,构建适用于社交媒体情感分类任务的情感知识图谱;接着使用GAN神经网络模型提高实体及实体关系的向量嵌入精度;再使用CBOW模型训练词向量,并利用知识图谱中的实体属性进行情感词向量训练;最后基于Bi-LSTM多特征融合情感分类策略,对词汇输入向量融合通用词向量、实体向量和情感词向量,以提高社交媒体应用中情感分类方法的处理性能与精度。本发明可有效解决传统情感分类方法普遍存在的精度不高、运算复杂等问题,能够快速、灵活地应用于社交媒体情感分类。
-
公开(公告)号:CN107682416B
公开(公告)日:2020-05-19
申请号:CN201710851632.2
申请日:2017-09-19
Applicant: 东南大学
IPC: H04L29/08
Abstract: 本发明公开了一种基于播存网络的雾计算架构内容协同分发方法及应用系统。本发明利用播存网络来提升传统雾计算架构的内容主动推送能力和减少其对互联网带宽的消耗,采用软件定义网络SDN的集中控制思想,提出兼顾广播内容和Web缓存内容的多粒度协同存储机制;在此基础上,通过控制器来集中维护和控制域内所有结点,并为域内雾服务器制定高效的内容转发策略;最后,通过控制器来实现域内多结点的内容协同分发。本发明可以有效增强雾计算架构的内容主动推送能力,减少用户请求时延,提升用户体验。
-
公开(公告)号:CN110287799A
公开(公告)日:2019-09-27
申请号:CN201910451449.2
申请日:2019-05-28
Applicant: 东南大学
Abstract: 本发明公开了一种基于深度学习的UCL语义标引方法与装置。首先利用神经网络提取视频低层语义特征;然后,基于特征灵活采样以及注意力机制,对视频自然语言描述生成模型SV2T进行改进,生成SV2T-FFSA模型,此模型以视频低层语义特征作为输入,输出视频自然语言描述特征,并结合语音自然语言描述特征生成视频关键词等高层语义特征,一定程度上解决了语义特征提取不充分的问题;最后,利用UCL能够标引丰富语义特征的特点,提出视频内容的UCL标引方法,使视频标引更加规范化。本发明既能精确地抽取视频丰富的语义特征,又能客观、规范地标引这些特征。
-
公开(公告)号:CN106372208B
公开(公告)日:2019-07-12
申请号:CN201610801675.5
申请日:2016-09-05
Applicant: 东南大学
Abstract: 本发明公开了一种基于语句相似度的话题观点聚类方法。本发明可以对互联网中围绕某一话题的主要观点进行聚类,首先利用人机结合的方式构建针对话题的观点词库,然后抽取话题的所有观点语句并利用观点语句的相似度进行观点聚类,最后根据语句平均相似度为每一观点类选取代表观点语句。本发明的优势在于能够确保聚类结果更加多样化和精细化,让用户能更清晰地了解该话题的各方观点及其细节,有效避免观点聚类及描述的模糊性和片面性。
-
公开(公告)号:CN108777674A
公开(公告)日:2018-11-09
申请号:CN201810373630.1
申请日:2018-04-24
Applicant: 东南大学
CPC classification number: H04L63/1483 , H04L41/147
Abstract: 本发明公开了一种基于多特征融合的钓鱼网站检测方法,该方法能够实时检测互联网上的钓鱼网站。本发明首先根据网页的URL提取URL特征、HTML特征和基于TF-IDF的文本向量;然后利用Logistic回归(Logistic regression)对文本向量进行分类,构建Logistic回归特征,并与网页URL特征和HTML特征进行多特征融合;最后训练XGBoost(eXtreme gradient boosting)模型,对待测钓鱼网站进行分类预测。本发明在网站的URL基础上,从多个维度全方位提取多关键特征,采用Logistic回归特征融合方法,有效解决文本向量特征维度过高问题,比现有特征融合方法能大幅提高运行效率,而且XGBoost分类模型比传统分类模型,更能提高钓鱼网站检测准确率,减少钓鱼网站检测漏报率。
-
公开(公告)号:CN108110789A
公开(公告)日:2018-06-01
申请号:CN201711306569.0
申请日:2017-12-11
Applicant: 国网江苏省电力有限公司经济技术研究院 , 中国电力工程顾问集团华东电力设计院有限公司 , 东南大学 , 国家电网公司
Abstract: 本发明公开了一种间歇性可再生能源分层分区并网规划方法,能够同时对多个间歇性可再生能源的分层分区接入点、电网的线路扩建方案,以及有功功率的外送容量进行优化规划;规划过程中,基于不同有功功率外送容量值分别求取接入点和线路最优方案,依据这些最优方案,通过生产模拟对生产成本、可靠性、电力外送收益指标进行评价,基于建设成本和上述评价指标,通过TOPSIS法实现有功功率外送容量、间歇性可再生能源接入点,以及电网线路扩建方案的最优方案决策。
-
公开(公告)号:CN106372180B
公开(公告)日:2017-08-25
申请号:CN201610785180.8
申请日:2016-08-30
Applicant: 东南大学
CPC classification number: H04L63/20 , G06F17/30 , G06F17/30876 , H04L63/08 , H04L67/1097
Abstract: 本发明公开了一种支持共享共治的内容元数据标识方法(简称MDCCSG方法)及应用方法,该标识方法针对大数据和泛媒体环境下的内容大数据共享共治需求提出,适用于对各种品类的内容资源进行统一标识,与之配套的应用方法可有效支持内容大数据的高效共享和科学治理等。MDCCSG方法包括三个部分:内容元数据的统一描述框架、内容元数据的统一规约方法、核心MDCCSG标识要素定义等,该标识方法既能详尽描述内容的丰富语义信息,又具有内嵌的(built‑in)内容可信认证与安全保障能力;基于MDCCSG标识可开发各种内容共享共治应用,能够有效支持内容大数据的高效聚合与分发、个性化主动服务、语义深度分析、认证注册管理、依法溯源追责等。
-
公开(公告)号:CN106372180A
公开(公告)日:2017-02-01
申请号:CN201610785180.8
申请日:2016-08-30
Applicant: 东南大学
CPC classification number: H04L63/20 , G06F17/30 , G06F17/30876 , H04L63/08 , H04L67/1097
Abstract: 本发明公开了一种支持共享共治的内容元数据标识方法(简称MDCCSG方法)及应用方法,该标识方法针对大数据和泛媒体环境下的内容大数据共享共治需求提出,适用于对各种品类的内容资源进行统一标识,与之配套的应用方法可有效支持内容大数据的高效共享和科学治理等。MDCCSG方法包括三个部分:内容元数据的统一描述框架、内容元数据的统一规约方法、核心MDCCSG标识要素定义等,该标识方法既能详尽描述内容的丰富语义信息,又具有内嵌的(built-in)内容可信认证与安全保障能力;基于MDCCSG标识可开发各种内容共享共治应用,能够有效支持内容大数据的高效聚合与分发、个性化主动服务、语义深度分析、认证注册管理、依法溯源追责等。
-
公开(公告)号:CN106250506A
公开(公告)日:2016-12-21
申请号:CN201610626850.1
申请日:2016-08-02
Applicant: 东南大学
CPC classification number: G06F9/3885 , G06F16/903
Abstract: 本发明公开了一种基于欧氏距离改进的kNN近邻查找方法。本发明利用欧式空间的特性,通过加减运算替换传统kNN方法中较为复杂的乘方运算,减少计算开销,在不降低查询准确率的条件下,实现对待分类样本的k近邻查找。本发明可有效减少部分样本点的计算量,降低kNN方法的时间复杂度;同时借助简化过程引入的临时变量,规避对全局集中式索引结构的依赖,将传统kNN方法由串行单线程处理模式,非常方便地扩展为多线程处理模式,提升处理器利用率并适应大数据处理的需求。
-
-
-
-
-
-
-
-
-