-
公开(公告)号:CN114418253A
公开(公告)日:2022-04-29
申请号:CN202110664342.3
申请日:2021-06-16
Applicant: 南京大学
Abstract: 本发明公开了一种基于图神经网络的自适应众包任务推荐方法,获取真实应用场景中的众包任务对象集合和推荐人群集合,根据众包任务对象和推荐人群依据经典KNN方法构建出众包网络图结构和推荐人群网络图结构;利用图神经网络方法GCN分别在众包网络图结构、推荐人群网络图结构上进行多轮信息传播,对众包任务以及推荐人进行任务嵌入表示和推荐人嵌入表示学习;递归的进行嵌入表示学习操作,多轮学习后,将得到的众包嵌入表示和推荐人嵌入表示采用t‑SNE映射到同一空间当中,根据邻近原则,将对应的任务推荐到具体到个人。本发明不仅可精准推荐众包任务到个人,而且比传统的众包任务推荐方法更加高效且准确,且更加科学合理。
-
公开(公告)号:CN110134786B
公开(公告)日:2021-09-10
申请号:CN201910397064.2
申请日:2019-05-14
Applicant: 南京大学
Abstract: 本发明公开了一种基于主题词向量与卷积神经网络的短文本分类方法,包括如下步骤:1)数据采集阶段:根据需求采集短文本数据,对其进行标签标注,作为训练集;2)数据预处理阶段:对文本进行分词,去停用词,无用文本过滤等;3)短文本特征表示,主题层面与词向量层面分别进行表征;4)主题词向量联合训练;5)卷积神经网络分类模型参数优化,迭代;6)新样本进行类别预测。本发明结合短文本数据特点,在特征表示阶段利用主题向量与词向量结合表示,对短文本自身数据特点进行语义特征扩展,在分类模型训练阶段利用卷积神经网络对局部敏感信息抽取能力进一步对文本语义信息进行挖掘,能够对短文本分类任务类别预测准确率等指标进行提高。
-
公开(公告)号:CN104820680B
公开(公告)日:2018-04-06
申请号:CN201510183709.4
申请日:2015-04-17
Applicant: 南京大学
IPC: G06F17/30
Abstract: 一种通用型分布式爬虫调度系统,包括控制器和爬虫器,控制器包含显示模块和调度模块,其中显示模块用于查看各种任务进展信息、日志以及触发对爬虫器的控制,调度模块包含通信区、维持区、数据保持区、数据缓存区;爬虫器包含爬取模块和调度模块,其中爬取模块实现具体的爬虫功能;调度模块包含通信区、维持区、数据保持区、数据缓存区;调度模块中的通信区之间采用Socket长连接异步通信方式完成互联;针对大数据时代获取数据效率低,存在丢失等问题,提出普适型、通用型的分布式爬虫系统框架,在保证爬取过程高速、有效、准确的同时兼容多样化的爬取策略。
-
公开(公告)号:CN104820680A
公开(公告)日:2015-08-05
申请号:CN201510183709.4
申请日:2015-04-17
Applicant: 南京大学
IPC: G06F17/30
Abstract: 一种通用型分布式爬虫调度系统,包括控制器和爬虫器,控制器包含显示模块和调度模块,其中显示模块用于查看各种任务进展信息、日志以及触发对爬虫器的控制,调度模块包含通信区、维持区、数据保持区、数据缓存区;爬虫器包含爬取模块和调度模块,其中爬取模块实现具体的爬虫功能;调度模块包含通信区、维持区、数据保持区、数据缓存区;调度模块中的通信区之间采用Socket长连接异步通信方式完成互联;针对大数据时代获取数据效率低,存在丢失等问题,提出普适型、通用型的分布式爬虫系统框架,在保证爬取过程高速、有效、准确的同时兼容多样化的爬取策略。
-
公开(公告)号:CN1838592A
公开(公告)日:2006-09-27
申请号:CN200610039896.X
申请日:2006-04-26
Applicant: 南京大学 , 江苏南大苏富特软件股份有限公司
Abstract: 基于高速数据处理平台的防火墙方法,由系统数据交换支持系统、数据接入及预处理板卡、防火墙数据处理板卡组成;数据接入板实现千兆线速转发,以及数据预处理,通过对需要进一步分析的数据包计算HASH,将它们动态负载均衡的发到多块防火墙处理板卡上进行处理;防火墙数据处理板并行运行,对数据包进行更深入的检查;采用梯度过滤机制:利用策略树和协议栈策略传递机制,将攻击检测、报文分拣、IP过滤、连接状态监控、用户认证、应用协议报文分析、应用协议通信状态检查、内容安全检查等动作,依次组织成一个力度递增的过滤体系:对传统防火墙软件体系的结构进行了调整和优化,达到了较高的网络处理性能。
-
公开(公告)号:CN1838137A
公开(公告)日:2006-09-27
申请号:CN200610039902.1
申请日:2006-04-26
Applicant: 南京大学 , 江苏南大苏富特软件股份有限公司
IPC: G06F21/00
Abstract: 一种对即插即用存储设备进行读写访问控制的方法,使用控制台、即插即用存储设备检测、文件系统过滤驱动部件、日志收集四个模块,其工作包含以下几个基本步骤:控制台模块配置即插即用存储设备使用安全策略;即插即用存储设备检测模块实时检测即插即用存储设备的插入,并通知内核挂接过滤设备,开启监控;文件系统过滤驱动部件模块根据策略实现即插即用存储设备访问监控的具体操作;即插即用存储设备检测模块实时检测即插即用存储设备的移除,并通知内核卸载过滤设备,停止监控。系统分应用层与内核层,在应用层实时检测可移动存储设备的插拔,及时通知内核模块挂接过滤设备进行监控。
-
公开(公告)号:CN108647191A
公开(公告)日:2018-10-12
申请号:CN201810473308.6
申请日:2018-05-17
Applicant: 南京大学
Abstract: 本发明提出一种基于有监督情感文本和词向量的情感词典构建方法,包括数据处理阶段、词向量情感嵌入阶段、情感词典生成阶段共三个阶段。本方法使用神经网络生成词向量,将情感嵌入到词向量内部,挖掘词与词之间的内在联系,然后构建词关系图,使用标签传播算法传播情感标签,自动构建特定领域的情感词典。通过本发明解决了基于人工和基于知识库的方法所构造的情感词典在处理特定领域的情感分析任务时不准确的问题。
-
公开(公告)号:CN104820945B
公开(公告)日:2018-06-22
申请号:CN201510186252.2
申请日:2015-04-17
Applicant: 南京大学
IPC: G06Q50/00
Abstract: 基于复杂网络社团发现算法的信息传播最大化方法,包括如下步骤:1)复杂网络生成阶段:预处理从在线社会网络上爬取到的数据变为有向带权图;模型训练阶段:a)利用社团发现算法对复杂网络进行社团发现。b)为每一个社团,输出对应的子图。c)为每一个子图进行不同种子节点选取实验。d)利用所产生数据进行训练模型,并把得到的模型保存到指定区域以待使用。2)种子节点选取阶段:a)要进行挖掘的原始复杂网络分割为不同的社团,并生成对应子图。b)导入模型训练阶段训练好的预测。c)利用预测模型计算出每个子图应分配到几个种子节点进行挖掘。复杂网络数据中选取最具传播能力节点时的时间效率。具有选取结果优,数据处理速度快等优点。
-
公开(公告)号:CN107423282A
公开(公告)日:2017-12-01
申请号:CN201710372958.7
申请日:2017-05-24
Applicant: 南京大学
IPC: G06F17/27
Abstract: 本发明提供一种基于混合特征的文本中语义连贯性主题与词向量并发提取方法,从而能够同时解决LDA主题模型中忽略局部上下文信息与词向量中忽略文档与词的互信息的缺陷。包括以下步骤:1)上下文依赖的主题预分配阶段;2)基于主题的词向量重构阶段;3)混合文档生成阶段;本发明基于混合特征的文本中语义连贯性主题与词向量并发提取方法能够在现有的生成式概率主题模型与词嵌入等相关技术的基础上,混合利用文本中的全局文档与词的统计信息以及局部的上下文词序与依赖信息,在提取出语义连贯的主题词分布的同时,为不同文档中的词生成不同的主题相关的词向量,有效解决同一词在不同主题下的歧义问题。
-
公开(公告)号:CN107133826A
公开(公告)日:2017-09-05
申请号:CN201710372954.9
申请日:2017-05-24
Applicant: 南京大学
IPC: G06Q30/02
CPC classification number: G06Q30/0275 , G06Q30/0277
Abstract: 本发明的目的在于为网站的广告区域提供基于离散化第一价格和比例分配模型的点击量拍卖机制。如何有效地为参与机制拍卖的广告主分配此广告区域,最大化地提高网站的收益,维持机制的稳定性正是我们的目标,为此提出了DFCA机制:将广告主的报价分段化处理,只能支付所规定的价格,网站根据每个广告主的支付价为其分配相应的点击量(每个广告所占的区域越大,所获得的点击量越高,网站根据每个广告主所需分配的点击量为其分配相应的面积)。此机制存在唯一均衡并为广告主提供他所期待的点击量。
-
-
-
-
-
-
-
-
-