-
公开(公告)号:CN111274790B
公开(公告)日:2023-05-16
申请号:CN202010090488.7
申请日:2020-02-13
Applicant: 东南大学
IPC: G06F40/211 , G06F40/284 , G06F40/295 , G06F16/35
Abstract: 本发明公开了一种基于句法依存图的篇章级事件嵌入方法及装置。首先,对每篇新闻文本,使用自然语言处理工具对其进行句法依存分析,构建句法依存关系图;接着,利用迭代更新算法计算句法依存图中各节点词的权重;然后,基于句法依存图,采用负采样技术构造正负训练样本;之后,分别构建并训练事件要素权重和关系预测模型,获得篇章级事件的低维稠密向量表示;最后,将事件嵌入向量输入到机器学习模型,应用于事件分类、聚类等相关任务。本发明基于句法依存图,采用无监督方式学习产生的向量表示能够改善传统基于词袋模型的事件表示的高维稀疏、语义和语法结构缺失问题,进而提升下游事件分析相关任务的效果。
-
公开(公告)号:CN109918621B
公开(公告)日:2023-02-28
申请号:CN201910119330.5
申请日:2019-02-18
Applicant: 东南大学
IPC: G06F40/30 , G06F40/289 , G06F40/194 , G06F16/951 , G06N3/0442 , G06N3/084
Abstract: 本发明公开了一种基于数字指纹和语义特征的新闻文本侵权检测方法与装置,能够通过检测文本相似性实时检测各大新闻媒体网站的新闻是否有侵权行为。本发明首先通过互联网采集新闻文本样本数据,并在新闻原文基础上构造出的侵权样本;然后利用word2vec模型实现新闻文本统一坐标系化,基于改进的局部敏感哈希方法提取文本指纹特征;接着基于长短时记忆循环神经网络模块,利用三元组损失学习文本语义特征;最后通过计算数字指纹特征和语义特征融合的相似度来判断文本是否有侵权。与现有技术相比,本发明将词语义嵌入到指纹中,更易检测出抄袭行为,并且同时利用数字特征和语义特征进行新闻文本相似度检测,能够有效提高新闻文本侵权检测的准确率。
-
公开(公告)号:CN109101478B
公开(公告)日:2022-04-08
申请号:CN201810564582.4
申请日:2018-06-04
Applicant: 东南大学
IPC: G06F40/289 , G06F40/30 , G06K9/62 , G06Q30/02
Abstract: 本发明公开了一种面向电商评论文本的Aspect级情感分析方法。首先,对电商评论文本进行预处理,并按照其所属的商品、商家、品牌进行分批;接着,在一批电商评论文本内部,综合考虑词性、句法及共现性特征,对候选评价对象的重要性进行排序,抽取电商评论文本中的评价对象;然后,利用动态滑动窗口机制将词项间共现限定在评论段级,并基于LDA模型对这一批电商评论文本中的评价对象进行聚类,得到评论Aspect‑评价对象间对应关系;最后,基于构建的情感词典、否定词典,对电商评论文本进行情感分析。本发明不仅可以挖掘电商评论文本中的评价对象,给出细粒度的评价对象级情感分析结果;还能充分利用具体商品、商家、品牌范围内评价对象间的主题相关性,对评价对象进行聚类,进而得到评论Aspect级情感分析结果。
-
公开(公告)号:CN109639837B
公开(公告)日:2021-04-06
申请号:CN201910096783.0
申请日:2019-01-31
Applicant: 东南大学
Abstract: 本发明公开了一种基于信任机制的区块链DPoS共识方法,该方法首先为区块链系统中的节点引入信任度和信任能级的概念,信任能级为Error的节点无法参与代理节点竞选,然后通过信任权利机制选举出代理节点;接着采用可验证随机函数在代理节点中抽选出记账节点;最后在区块链网络运行过程中,对节点行为进行信任奖惩,对降到Error能级的记账节点采取中断剔除策略。本发明通过对节点信任能级的跟踪以及节点的信任奖惩,降低恶意节点成为记账节点的概率,提高普通节点的参与积极度,保证整个共识方法的可靠性,并且以信任度作为股权证明,不需要额外的代币分发。
-
公开(公告)号:CN109871464A
公开(公告)日:2019-06-11
申请号:CN201910042426.6
申请日:2019-01-17
Applicant: 东南大学
IPC: G06F16/732 , G06K9/00 , G06N3/04
Abstract: 本发明公开了一种基于UCL语义标引的视频推荐方法与装置。首先,本发明基于SSD神经网络模型,过滤最后一层生成的无用提案框,并且拼接中间层生成的人脸特征,对视频进行目标检测与人脸识别,提高视频信息提取的速度与精度。接着,采用UCL国家标准对视频进行语义标引,并基于检测目标的重合度,对视频进行自动分段,实现视频的规范化、细粒度标引。最后,构建知识库存储UCL之间的关系,并基于知识库提出两阶段智能化个性化推荐策略,解决传统推荐冷启动、运算复杂等问题,提高推荐系统的性能。本发明既能提高视频信息抽取的速度和精度,又能灵活、准确地进行视频个性化推荐。
-
公开(公告)号:CN108509517A
公开(公告)日:2018-09-07
申请号:CN201810195967.8
申请日:2018-03-09
Applicant: 东南大学
Abstract: 本发明公开了一种面向实时新闻内容的流式话题演化跟踪方法,首先把实时采集的新闻内容,按时间段进行分批,对每一批新闻内容采用LDA方法挖掘初步话题结果;接着,在这一批新闻内容内部进行命名实体识别,并计算话题与实体间关联,以此更新实体库中的实体链接关系;然后,通过话题内部词项聚类,得到话题-话题内类簇对应关系,并将话题结果存入话题库;最后,计算话题及其内部类簇的热度信息,并根据热度信息对LDA话题挖掘参数进行动态更新,供下一批新闻内容的话题演化跟踪使用。本发明可挖掘实时新闻内容中的话题特征以及话题内词项的类簇特征,充分利用话题间以及话题内不同类簇间的差异性,对LDA话题挖掘参数进行动态更新。
-
公开(公告)号:CN107682416A
公开(公告)日:2018-02-09
申请号:CN201710851632.2
申请日:2017-09-19
Applicant: 东南大学
IPC: H04L29/08
Abstract: 本发明公开了一种基于播存网络的雾计算架构内容协同分发方法及应用系统。本发明利用播存网络来提升传统雾计算架构的内容主动推送能力和减少其对互联网带宽的消耗,采用软件定义网络SDN的集中控制思想,提出兼顾广播内容和Web缓存内容的多粒度协同存储机制;在此基础上,通过控制器来集中维护和控制域内所有结点,并为域内雾服务器制定高效的内容转发策略;最后,通过控制器来实现域内多结点的内容协同分发。本发明可以有效增强雾计算架构的内容主动推送能力,减少用户请求时延,提升用户体验。
-
公开(公告)号:CN111538835B
公开(公告)日:2023-05-23
申请号:CN202010238006.8
申请日:2020-03-30
Applicant: 东南大学
IPC: G06F16/35 , G06F16/36 , G06F40/295 , G06N3/045 , G06N3/0475 , G06N3/0442
Abstract: 本发明公开了一种基于知识图谱的社交媒体情感分类方法与装置。首先基于构建基础知识图谱,并结合情感词典对基础知识图谱中的实体进行情感实体定位和情感极性标注,构建适用于社交媒体情感分类任务的情感知识图谱;接着使用GAN神经网络模型提高实体及实体关系的向量嵌入精度;再使用CBOW模型训练词向量,并利用知识图谱中的实体属性进行情感词向量训练;最后基于Bi‑LSTM多特征融合情感分类策略,对词汇输入向量融合通用词向量、实体向量和情感词向量,以提高社交媒体应用中情感分类方法的处理性能与精度。本发明可有效解决传统情感分类方法普遍存在的精度不高、运算复杂等问题,能够快速、灵活地应用于社交媒体情感分类。
-
公开(公告)号:CN109101552B
公开(公告)日:2022-01-28
申请号:CN201810750707.2
申请日:2018-07-10
Applicant: 东南大学
IPC: G06F16/955 , G06N3/04
Abstract: 本发明公开了一种基于深度学习的钓鱼网站URL检测方法,该方法仅根据网站URL就能够实时检测互联网上的钓鱼网站。本发明首先将URL字符串序列编码成one‑hot二维稀疏矩阵,接着转化为稠密字符嵌入矩阵,输入到卷积神经网络中,抽取局部深度特征,然后将卷积神经网络的输出输入到长短期记忆网络,捕获URL序列的前后关联,最后接入softmax模型,对URL分类。本发明能避免繁冗的特征工程,通过卷积神经网络抽取局部深度关联性特征,通过长短期记忆网络学习URL中的长程依赖,能快速、准确地检测出钓鱼网站URL。
-
公开(公告)号:CN110287799B
公开(公告)日:2021-03-19
申请号:CN201910451449.2
申请日:2019-05-28
Applicant: 东南大学
Abstract: 本发明公开了一种基于深度学习的UCL语义标引方法与装置。首先利用神经网络提取视频低层语义特征;然后,基于特征灵活采样以及注意力机制,对视频自然语言描述生成模型S2VT进行改进,生成S2VT‑FFSA模型,此模型以视频低层语义特征作为输入,输出视频自然语言描述特征,并结合语音自然语言描述特征生成视频关键词等高层语义特征,一定程度上解决了语义特征提取不充分的问题;最后,利用UCL能够标引丰富语义特征的特点,提出视频内容的UCL标引方法,使视频标引更加规范化。本发明既能精确地抽取视频丰富的语义特征,又能客观、规范地标引这些特征。
-
-
-
-
-
-
-
-
-