-
公开(公告)号:CN109918621B
公开(公告)日:2023-02-28
申请号:CN201910119330.5
申请日:2019-02-18
Applicant: 东南大学
IPC: G06F40/30 , G06F40/289 , G06F40/194 , G06F16/951 , G06N3/0442 , G06N3/084
Abstract: 本发明公开了一种基于数字指纹和语义特征的新闻文本侵权检测方法与装置,能够通过检测文本相似性实时检测各大新闻媒体网站的新闻是否有侵权行为。本发明首先通过互联网采集新闻文本样本数据,并在新闻原文基础上构造出的侵权样本;然后利用word2vec模型实现新闻文本统一坐标系化,基于改进的局部敏感哈希方法提取文本指纹特征;接着基于长短时记忆循环神经网络模块,利用三元组损失学习文本语义特征;最后通过计算数字指纹特征和语义特征融合的相似度来判断文本是否有侵权。与现有技术相比,本发明将词语义嵌入到指纹中,更易检测出抄袭行为,并且同时利用数字特征和语义特征进行新闻文本相似度检测,能够有效提高新闻文本侵权检测的准确率。
-
公开(公告)号:CN115065678A
公开(公告)日:2022-09-16
申请号:CN202210362289.6
申请日:2022-04-07
Applicant: 东南大学
Abstract: 本发明公开了一种基于深度强化学习的多智能设备任务卸载决策方法,用于解决物联网环境下具有多个智能终端设备的云边端融合网络中混合任务卸载和资源分配问题,该方法以数据传输速率作为性能评价指标。首先,获取该环境中每个智能终端设备以及环境的配置信息,然后建立以最大数据传输速率为目标的多智能终端设备卸载模型,最后基于深度强化学习方法求解最优任务卸载方案,再依据总体最优卸载方案进行任务卸载。本发明能够有效解决多接入边缘计算(MEC)网络中多智能设备混合任务卸载和资源分配的问题。
-
公开(公告)号:CN114896377A
公开(公告)日:2022-08-12
申请号:CN202210360978.3
申请日:2022-04-07
Applicant: 东南大学
IPC: G06F16/332
Abstract: 本发明公开了一种基于知识图谱的答案获取方法,具体如下:从问题与候选答案中提取相关的关键词信息;在知识图谱中提取从问题当中的关键词到选项当中关键词的路径;将路径输入路径证据聚合器PEF和图证据聚合器GEF当中,分别得到相关的路径证据信息和图证据信息;将题目与选项组合成状态向量并输入文本证据聚合器TEF当中,利用TEF当中的预训练语言模型捕捉文本之间的语义关联,获得知识图谱之外的特征;将以上获得的三种不同来源的证据融合成特征向量并最后得到选择分数。充分利用题目给定的信息,在捕获题目当中单词语义关系的同时,还能利用知识图谱获得相关的证据信息进行答案选择,将结构化和非结构化的证据相结合,推荐准确率高,可解释性好。
-
公开(公告)号:CN114781367A
公开(公告)日:2022-07-22
申请号:CN202210422977.7
申请日:2022-04-21
Applicant: 东南大学
IPC: G06F40/284 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于词干信息融合的关键词生成方法,该方法首先提取词干信息,将词干信息融入Embedding层,以增强同词干单词的强关联性;接着搜索文本中同词干变种组合构建参考文本,通过编码层模块提取参考文本中的词语义信息;再基于初始文本和参考文本加权扩充生成概率分布,采用双软开关复制机制修正复制机制带来的生成偏差;然后在译码器层面构建词干生成任务,通过词与词干的多任务联合训练获得最终关键词生成概率分布,缓解训练偏差导致网络性能无法充分发挥的问题,最后基于BeamSearch方法生成关键词。相比其他方法,本发明方法以词形态学为基础,生成能力强,预测准确率高,在文本理解方面具有明显优势。
-
公开(公告)号:CN114757185A
公开(公告)日:2022-07-15
申请号:CN202210421678.1
申请日:2022-04-21
Applicant: 东南大学
IPC: G06F40/289 , G06F40/242 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于动态图注意力胶囊网络的谣言检测方法与装置,能够对社交媒体中的帖子进行谣言识别,从而提供给用户检测谣言的预判机制。本发明首先使用动态网络框架DYN对谣言传播过程中积累的评论以时间顺序进行划分,形成多个静态的以图为基础的子评论结构;然后利用图注意力胶囊网络模块GACN对每个子评论结构进行编码形成子结构分类胶囊,从而挖掘谣言文本的属性特征;最后设计分类胶囊注意力机制整合各子分类胶囊捕获谣言评论结构随时间动态演化过程中的动态交互特征,进而获得谣言检测结果。本发明能够有效挖掘谣言文本深层次的属性以及评论结构随时间演化的动态交互特征,提升了谣言检测任务的准确率。
-
公开(公告)号:CN114692605A
公开(公告)日:2022-07-01
申请号:CN202210415569.9
申请日:2022-04-20
Applicant: 东南大学
IPC: G06F40/211 , G06F40/289 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种融合句法结构信息的关键词生成方法及装置,能够为新闻文章自动地生成关键词。本发明首先使用爬虫工具采集新闻文章,并采取人工标注参考关键词构造出新闻文章数据集;然后对文本进行预处理,依存句法分析和过滤停用词;接着基于循环神经网络的顺序编码器和基于图卷积网络的图编码器分别获取文章的上下文语义和结构特征,并利用聚类方法将文本分为包含不同子主题部分,并利用多个基于注意力机制的解码器并行生成关键词;采样交叉熵损失进行模型参数优化;最后基于训练后的模型对待处理的新闻文章进行自动关键词生成。本发明通过句法结构信息弥补顺序编码存在的长距离单词依赖信息损失问题,从而提高生成关键词的质量。
-
公开(公告)号:CN114692604A
公开(公告)日:2022-07-01
申请号:CN202210398830.9
申请日:2022-04-16
Applicant: 东南大学
IPC: G06F40/211 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于深度学习的方面级情感分类方法,具体如下,构筑方面级情感分类数据集;将数据集中的方面级特征嵌入到语义空间中;使用基于对抗BERT的编码器进行特征编码;基于线性变换的方面级句子特征压缩层对编码后的结果进行线性变换,使其满足胶囊网络计算的需要;基于胶囊网络的方面级句子特征提取层对压缩后的矩阵进一步的特征提取,捕获方面词与其对应上下文的语义关系;融标签正则化机制的情感分类层依据模型学习到的内容对文本进行方面级情感分类,可用于社交媒体文本的方面级情感分类,本发明基于对句子的方面级特征进行充分地学习,结合对抗训练机制将数据集的效果发挥到最大化,在复杂的场景下仍能表现出良好的效果,具有准确率高、鲁棒性好的特点。
-
公开(公告)号:CN109101478B
公开(公告)日:2022-04-08
申请号:CN201810564582.4
申请日:2018-06-04
Applicant: 东南大学
IPC: G06F40/289 , G06F40/30 , G06K9/62 , G06Q30/02
Abstract: 本发明公开了一种面向电商评论文本的Aspect级情感分析方法。首先,对电商评论文本进行预处理,并按照其所属的商品、商家、品牌进行分批;接着,在一批电商评论文本内部,综合考虑词性、句法及共现性特征,对候选评价对象的重要性进行排序,抽取电商评论文本中的评价对象;然后,利用动态滑动窗口机制将词项间共现限定在评论段级,并基于LDA模型对这一批电商评论文本中的评价对象进行聚类,得到评论Aspect‑评价对象间对应关系;最后,基于构建的情感词典、否定词典,对电商评论文本进行情感分析。本发明不仅可以挖掘电商评论文本中的评价对象,给出细粒度的评价对象级情感分析结果;还能充分利用具体商品、商家、品牌范围内评价对象间的主题相关性,对评价对象进行聚类,进而得到评论Aspect级情感分析结果。
-
公开(公告)号:CN114048309A
公开(公告)日:2022-02-15
申请号:CN202111365252.0
申请日:2021-11-17
Applicant: 东南大学
Abstract: 本发明公开了一种问题驱动的社交网络答案摘要自动生成方法,所述方法包括以下步骤:步骤1:社交网络文本采集;步骤2:数据预处理;步骤3:模型训练;步骤4:模型测试与文本生成,本发明能够改善传统摘要生成方法中过度依赖语义关联性而导致泛化能力低和缺乏可推理性等问题,进而提升生成摘要的可读性、流畅性和简洁性。
-
公开(公告)号:CN109639837B
公开(公告)日:2021-04-06
申请号:CN201910096783.0
申请日:2019-01-31
Applicant: 东南大学
Abstract: 本发明公开了一种基于信任机制的区块链DPoS共识方法,该方法首先为区块链系统中的节点引入信任度和信任能级的概念,信任能级为Error的节点无法参与代理节点竞选,然后通过信任权利机制选举出代理节点;接着采用可验证随机函数在代理节点中抽选出记账节点;最后在区块链网络运行过程中,对节点行为进行信任奖惩,对降到Error能级的记账节点采取中断剔除策略。本发明通过对节点信任能级的跟踪以及节点的信任奖惩,降低恶意节点成为记账节点的概率,提高普通节点的参与积极度,保证整个共识方法的可靠性,并且以信任度作为股权证明,不需要额外的代币分发。
-
-
-
-
-
-
-
-
-