-
公开(公告)号:CN108681433A
公开(公告)日:2018-10-19
申请号:CN201810419353.3
申请日:2018-05-04
Applicant: 南京信息工程大学
CPC classification number: G06F3/0641 , G06K9/6215 , G06K9/6256 , G06K9/6269
Abstract: 一种用于重复数据删除的抽样选择方法,该方法基于Sig‑Dedup框架,得到初始块阈值,进而从大规模数据集中过滤出可能的匹配对放入一个新的集合S,并按相似度递增排序,然后将该集合按相似度等级随机抽取出一定数量的信息对生成经验规模的样本。通过SSAR主动学习算法,对各等级的样本进一步去除不翔实或者冗余的信息对,生成更具代表性的训练集交由专家标记,然后用它确定模糊边界值,紧接着用模糊边界值和已标记集训练支持向量机分类器SVM,自动判定模糊区域内信息对是否匹配,从而减少了需要人工标记的信息对数量。本发明大大细化了抽样选择过程,减小需要手工标记的信息对数量,极大减小专家标记成本。
-
公开(公告)号:CN109102108B
公开(公告)日:2021-10-26
申请号:CN201810782663.1
申请日:2018-07-16
Applicant: 南京信息工程大学
Abstract: 本发明涉及一种基于通信数据和神经网络的实时地铁人流密度预测方法,属于大数据与深度学习技术领域。包括数据预处理、构建和训练权值共享循环神经网络模型、实时预测地铁人流密度三个步骤,先构建地铁进出站数据集B,对一定距离范围内的通信数据进行清洗得到数据集C,以K个地铁站为聚类中心对数据集C进行处理,统计每类包含的乘客数p并作为t时刻的潜在乘客;组合数据集B、C,得到数据集A(t);再构建和训练权值共享循环神经网络模型,输入A(t),计算t时刻下的隐藏层神经元输出ht,然后计算共享层的输出st,最终计算输出yt,即可。本发明可以准确、快速地给出实时的地铁人流密度的预测,包括地铁站附近特殊情况下的人流密度预测。
-
公开(公告)号:CN108629009A
公开(公告)日:2018-10-09
申请号:CN201810424875.2
申请日:2018-05-04
Applicant: 南京信息工程大学
Abstract: 基于FrankCopula函数的主题相关性建模方法,包括如下步骤:随机初始化参数并选取超参数;根据初始化参数和超参数,使用LDA模型生成第一篇文档的主题分布和主题词分布;根据第一篇文档的主题分布和主题词分布,结合Copula函数计算每一篇文档的主题分布和主题词分布;根据计算的主题分布和主题词分布,对每篇文档的主题和主题词排序,根据概率大小选取文档的主题和主题词输出。本发明针对目前LDA模型中文档-主题分布不考虑连续文档间的互相影响的问题,引入Frank Copula工具来生成连续文档的主题相关性模型,考虑了前一篇对后一篇文档的主题分布的影响,提高了主题模型的准确度。
-
公开(公告)号:CN109102108A
公开(公告)日:2018-12-28
申请号:CN201810782663.1
申请日:2018-07-16
Applicant: 南京信息工程大学
Abstract: 本发明涉及一种基于通信数据和神经网络的实时地铁人流密度预测方法,属于大数据与深度学习技术领域。包括数据预处理、构建和训练权值共享循环神经网络模型、实时预测地铁人流密度三个步骤,先构建地铁进出站数据集B,对一定距离范围内的通信数据进行清洗得到数据集C,以K个地铁站为聚类中心对数据集C进行处理,统计每类包含的乘客数p并作为t时刻的潜在乘客;组合数据集B、C,得到数据集A(t);再构建和训练权值共享循环神经网络模型,输入A(t),计算t时刻下的隐藏层神经元输出ht,然后计算共享层的输出st,最终计算输出yt,即可。本发明可以准确、快速地给出实时的地铁人流密度的预测,包括地铁站附近特殊情况下的人流密度预测。
-
公开(公告)号:CN109063030A
公开(公告)日:2018-12-21
申请号:CN201810777605.X
申请日:2018-07-16
Applicant: 南京信息工程大学
CPC classification number: G06F17/2715
Abstract: 本发明公开一种基于流式LDA主题模型发现文档隐含主题和主题词的方法,属于机器学习的自然语言处理技术领域。在LDA模型的基础上考虑文档间主题和主题词的互相影响,对连续文档进行准确的隐含主题和主题词发现,包括随机初始化参数和选取超参数、随机生成每篇文档主题的先验分布和每个主题词的主题词分布、将文档中的词分配给某个主题、计算主题和主题词的极大似然函数和后验分布并更新所有的分布和参数、按概率对文档的主题和主题词进行降序排序输出最大概率的几个主题及其主题词五个步骤。具有可充分考虑相邻文档间主题的相互影响,得到的文档的主题分布较现有的技术更加贴近于主题的真实分布,获取文档的主题以及其主题词更加精准等优点。
-
公开(公告)号:CN207995343U
公开(公告)日:2018-10-19
申请号:CN201820467621.4
申请日:2018-03-30
Applicant: 南京信息工程大学
IPC: H04R1/10
Abstract: 本实用新型公开了自适应U型耳机支架,属于耳机技术领域,自适应U型耳机支架,包括支架主体和弹簧,在支架主体的底部设置底板,弹簧的一端固定在底板上,弹簧的另一端竖直向上伸出支架主体,并在弹簧另一端上设置头梁托。本实用新型的自适应U型耳机支架可以自动适用不同形状大小的耳机,对耳机的头梁进行有效的保护,尤其适用于有耳机收藏爱好的消费者,以及需要进行耳机展示的商家,不用根据耳机的不同去置办不同的耳机支架;整个耳机支架的结构简单,成本低,易于推广应用,具备很好的实用性。
-
公开(公告)号:CN207995342U
公开(公告)日:2018-10-19
申请号:CN201820466744.6
申请日:2018-03-30
Applicant: 南京信息工程大学
IPC: H04R1/10
Abstract: 本实用新型公开了多功能U型耳机支架,属于耳机技术领域,包括支架主体,所述的支架主体设置在底座上,在支架主体的中上部设置数据线收纳区,在数据线收纳区的下方设置挂勾。本实用新型的多功能U型耳机支架,一物多用,将电脑桌面上需要的收纳,耳机架,音响,充电接口问题全部整合,释放电脑桌面的空间;无论是在办公时还是娱乐时,都可以节约出大量的空间用于其他的事情,让电脑桌面更加整洁有序。
-
-
-
-
-
-