-
公开(公告)号:CN113094587B
公开(公告)日:2024-04-16
申请号:CN202110443867.4
申请日:2021-04-23
Applicant: 东南大学
IPC: G06F16/9535 , G06F16/9536 , G06F16/36 , G06Q50/00
Abstract: 本发明提供了一种基于知识图谱路径的隐式推荐方法,包括如下步骤:在知识图谱中提取用户和候选item之间的路径;将路径输入注意力知识路径模块AKPM中,捕获知识图谱中用户和候选item之间的显式特征;将用户的历史交互记录和候选item输入IFEM中,捕获知识图谱之外的隐式特征;融合显式和隐式特征向量得到推荐分数。本发明充分利用用户的行为记录,在捕获用户和候选item之间的显式特征的同时,还能够捕获知识图谱之外item之间的知识图谱之外的隐式特征,将显式和隐式特征融合并用于推荐,相比其他方法,本发明方法推荐准确率高,可解释性好。
-
公开(公告)号:CN117411463A
公开(公告)日:2024-01-16
申请号:CN202311724481.6
申请日:2023-12-15
Applicant: 南京群顶科技股份有限公司 , 东南大学
Abstract: 本发明公开了一种面向边缘计算网关数据采集自适应滤波方法,方法包括以下步骤:步骤1,主机与IO板卡通信,获取IO板卡设备地址;步骤2,主机读取IO板卡注册表信息,获取IO板卡的型号;步骤3,判断IO板卡型号对应含模拟数据的通道,以获取到待滤波模拟数据;步骤4,调用自适应滤波器对模拟数据数据进行滤波。本发明避免了复杂的设备查询和匹配过程,简化了数据采集的流程,还提高了数据的质量和可靠性;采用的自适应卡尔曼滤波器有效的对非线性系统进行自适应滤波,使用更加灵活,具有较低的计算复杂性,更加适用于资源受限的环境,实现了面向边缘计算网关数据的采集和滤波的全自动化过程。
-
公开(公告)号:CN115774995A
公开(公告)日:2023-03-10
申请号:CN202211538484.6
申请日:2022-12-02
Applicant: 东南大学
IPC: G06F40/284 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于最优传输理论的关键词生成方法,如图1所示,方法包括以下步骤:步骤1:数据预处理;步骤2:损失函数构建;步骤3:模型训练;步骤4:模型测试与评估。本发明基于最优传输理论构建损失函数,加强模型捕获文本语义信息的能力,进而使得模型能够生成更加贴合文本语义的关键词,降低与文本语义无关甚至相悖的缺失关键词的出现,提升关键词的质量。
-
公开(公告)号:CN114969279A
公开(公告)日:2022-08-30
申请号:CN202210380864.5
申请日:2022-04-12
Applicant: 东南大学
IPC: G06F16/332 , G06F16/35 , G06F40/174 , G06K9/62 , G06N3/04 , G06N3/08 , G06N5/04
Abstract: 本发明公开了一种基于层次图神经网络的表格文本问答方法,该方法首先通过稀疏检索器快速召回与问题关联的文本证据信息,并将这些证据信息填充到表格中;接着利用表格行选择模型对表格行打分排序,从而找到最有可能包含答案的答案行;然后对答案行以及关联文本融合编码得到特征向量表示,进而使用基于表格行的层次图神经网络对问题、单元格、短文进行图推理,以捕捉表格特有的半结构化信息;最后,通过三个相互关联的子任务求解得到问题对应的答案。本发明能够有效地解决表格和文本相互补充场景下的多跳问答问题。
-
公开(公告)号:CN114925211A
公开(公告)日:2022-08-19
申请号:CN202210385244.0
申请日:2022-04-13
Applicant: 东南大学
IPC: G06F16/36 , G06F16/35 , G06N3/04 , G06F16/901
Abstract: 本发明公开了一种面向表格型数据的事实验证方法,能够用于检验网络上声明的真实性,包括如下步骤:首先针对输入的表格数据和文本声明,利用DeBERTa模型获得单一模态的编码表示;然后将单一模态的编码表示作为交叉模态Transformer模块的输入,分别获得融合模态间信息的表格表示和文本声明表示;最后通过构建一个图神经网络,提取表格的结构信息以及文本的语义信息来进行信息传递和推理;最后利用一个多层感知器获得声明真实性的预测结果,本发明结合图神经网络来对表格数据进行表示,并联合多模态技术增强文本声明和表格数据之间的交互,增强了模型的表示学习能力和推理能力,从而提高了声明真实性预测的准确性。
-
公开(公告)号:CN113326695A
公开(公告)日:2021-08-31
申请号:CN202110455888.8
申请日:2021-04-26
Applicant: 东南大学
IPC: G06F40/247 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于迁移学习的情感极性分析方法,本发明首先构建文本排序模型,弥补当前语言模型缺乏句子级预训练任务的缺陷,提高模型的逻辑感知与语义表达能力。然后,构建情感极性分析模型,将文本排序模型训练得到的相关参数迁移到情感极性分析模型中对应的位置。最后,将迁移后的模型在情感极性分析数据集上继续训练。本发明利用迁移学习为情感极性分析模型引入领域先验知识,可以提高模型的领域适应性,有助于获取更高质量的句子特征,进而提高模型的分类准确率,并且,本发明所采用的注意力机制可以为情感极性分析模型降低评论文本的噪声干扰,提高模型的分类鲁棒性。
-
公开(公告)号:CN108509517B
公开(公告)日:2021-05-11
申请号:CN201810195967.8
申请日:2018-03-09
Applicant: 东南大学
IPC: G06F16/35 , G06F16/36 , G06F16/9535 , G06F40/295 , G06F40/30
Abstract: 本发明公开了一种面向实时新闻内容的流式话题演化跟踪方法,首先把实时采集的新闻内容,按时间段进行分批,对每一批新闻内容采用LDA方法挖掘初步话题结果;接着,在这一批新闻内容内部进行命名实体识别,并计算话题与实体间关联,以此更新实体库中的实体链接关系;然后,通过话题内部词项聚类,得到话题‑话题内类簇对应关系,并将话题结果存入话题库;最后,计算话题及其内部类簇的热度信息,并根据热度信息对LDA话题挖掘参数进行动态更新,供下一批新闻内容的话题演化跟踪使用。本发明可挖掘实时新闻内容中的话题特征以及话题内词项的类簇特征,充分利用话题间以及话题内不同类簇间的差异性,对LDA话题挖掘参数进行动态更新。
-
公开(公告)号:CN108110789B
公开(公告)日:2021-01-12
申请号:CN201711306569.0
申请日:2017-12-11
Applicant: 国网江苏省电力有限公司经济技术研究院 , 中国电力工程顾问集团华东电力设计院有限公司 , 东南大学 , 国家电网公司
Abstract: 本发明公开了一种间歇性可再生能源分层分区并网规划方法,能够同时对多个间歇性可再生能源的分层分区接入点、电网的线路扩建方案,以及有功功率的外送容量进行优化规划;规划过程中,基于不同有功功率外送容量值分别求取接入点和线路最优方案,依据这些最优方案,通过生产模拟对生产成本、可靠性、电力外送收益指标进行评价,基于建设成本和上述评价指标,通过TOPSIS法实现有功功率外送容量、间歇性可再生能源接入点,以及电网线路扩建方案的最优方案决策。
-
公开(公告)号:CN111274790A
公开(公告)日:2020-06-12
申请号:CN202010090488.7
申请日:2020-02-13
Applicant: 东南大学
IPC: G06F40/211 , G06F40/284 , G06F40/295 , G06F16/35
Abstract: 本发明公开了一种基于句法依存图的篇章级事件嵌入方法及装置。首先,对每篇新闻文本,使用自然语言处理工具对其进行句法依存分析,构建句法依存关系图;接着,利用迭代更新算法计算句法依存图中各节点词的权重;然后,基于句法依存图,采用负采样技术构造正负训练样本;之后,分别构建并训练事件要素权重和关系预测模型,获得篇章级事件的低维稠密向量表示;最后,将事件嵌入向量输入到机器学习模型,应用于事件分类、聚类等相关任务。本发明基于句法依存图,采用无监督方式学习产生的向量表示能够改善传统基于词袋模型的事件表示的高维稀疏、语义和语法结构缺失问题,进而提升下游事件分析相关任务的效果。
-
公开(公告)号:CN109918621A
公开(公告)日:2019-06-21
申请号:CN201910119330.5
申请日:2019-02-18
Applicant: 东南大学
IPC: G06F17/22 , G06F17/27 , G06F16/951 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于数字指纹和语义特征的新闻文本侵权检测方法与装置,能够通过检测文本相似性实时检测各大新闻媒体网站的新闻是否有侵权行为。本发明首先通过互联网采集新闻文本样本数据,并在新闻原文基础上构造出的侵权样本;然后利用word2vec模型实现新闻文本统一坐标系化,基于改进的局部敏感哈希方法提取文本指纹特征;接着基于长短时记忆循环神经网络模块,利用三元组损失学习文本语义特征;最后通过计算数字指纹特征和语义特征融合的相似度来判断文本是否有侵权。与现有技术相比,本发明将词语义嵌入到指纹中,更易检测出抄袭行为,并且同时利用数字特征和语义特征进行新闻文本相似度检测,能够有效提高新闻文本侵权检测的准确率。
-
-
-
-
-
-
-
-
-