-
公开(公告)号:CN115314287B
公开(公告)日:2024-08-20
申请号:CN202210942026.2
申请日:2022-08-08
Applicant: 大连理工大学
Abstract: 本发明属于网络安全、数据挖掘、人工智能技术领域,公开了一种基于深度聚类的对抗异常检测系统,对高维复杂的多媒体数据进行异常检测。针对现有检测系统忽略正常数据与异常数据之间差异的问题,本发明的系统利用深度聚类模块对正常数据和异常数据在隐空间进行划分。通过深度聚类阶段,深度聚类模块可以学到正常数据与异常数据的簇状结信息。此外,该系统采用零和博弈思想,构建对抗异常检测模块学习正常数据在隐空间的特征分布信息。为了获得可靠的异常检测结果,系统采用自适应异常检测评估策略来判定输入数据是否存在异常。本发明在效率以及效果上均获得不错的表,为基于深度学习的异常检测系统提供一种新的框架。
-
公开(公告)号:CN113591879A
公开(公告)日:2021-11-02
申请号:CN202110831409.8
申请日:2021-07-22
Applicant: 大连理工大学
Abstract: 本发明公开了基于自监督学习的深度多视图聚类方法、网络、装置及存储介质,属于深度多视图聚类领域,应用于异常点检测、多种产品的价值组合和目标用户的群体划分等多种应用场景,该方法使用了一种自监督的成对约束传播模型,通过融合的自编码器提取多个视图的潜在一致特征后基于多视图的共性特征可以自动地从数据中挖掘监督约束信息,随后用于优化聚类特征提取模型,充分地挖掘了数据的潜在价值,有效地降低了人工标记的成本同时提升了多视图聚类的性能,实验证明,本发明提出的方法相比现存的基准算法能取得更好的结果。
-
公开(公告)号:CN107357763A
公开(公告)日:2017-11-17
申请号:CN201710433595.3
申请日:2017-06-12
Applicant: 大连理工大学
Abstract: 本发明公开了一种基于自步学习的众包分类数据质量控制方法,属于计算机科学数据挖掘技术领域。用于多分类众包标注任务的真实分类发现,以及恶意工作者识别。首先,方法根据初始数据集性质计算样本可信度,然后选择样本,然后计算真实标签以及工作者能力,接着根据更新的能力和真实标签重新选择样本然后,在完全选择到全部的样本点之后,进一步优化,最终同时获取标注真实答案以及工作者的能力与恶意与消极工作者识别结果。实验证明,本发现的方法相比传统方法能取得更好的结果。
-
公开(公告)号:CN107273355A
公开(公告)日:2017-10-20
申请号:CN201710435279.X
申请日:2017-06-12
Applicant: 大连理工大学
IPC: G06F17/27
Abstract: 本发明公开了一种基于字词联合训练的中文词向量生成方法,属于自然语言处理技术领域。将词中的汉字信息作为重要特征,结合上下文词和汉字,联合训练中文的词向量表示。在基于词本身的词向量模型的基础上,我们通过引入词本身的组成汉字信息,在基于上下文词预测目标词的同时,基于上下文字预测目标词。将基于词本身的模型字词联合训练模型分别应用,比较两个模型的训练词向量的有效性和鲁棒性,发现字词联合训练模型生成的中文词向量更符合中文语义特性,同时鲁棒性也更好。本发明提供了中文词向量生成的一种新方法,为中文词向量的生成和应用工作提供了一种新的解决方案。
-
公开(公告)号:CN115314287A
公开(公告)日:2022-11-08
申请号:CN202210942026.2
申请日:2022-08-08
Applicant: 大连理工大学
Abstract: 本发明属于网络安全、数据挖掘、人工智能技术领域,公开了一种基于深度聚类的对抗异常检测系统,对高维复杂的多媒体数据进行异常检测。针对现有检测系统忽略正常数据与异常数据之间差异的问题,本发明的系统利用深度聚类模块对正常数据和异常数据在隐空间进行划分。通过深度聚类阶段,深度聚类模块可以学到正常数据与异常数据的簇状结信息。此外,该系统采用零和博弈思想,构建对抗异常检测模块学习正常数据在隐空间的特征分布信息。为了获得可靠的异常检测结果,系统采用自适应异常检测评估策略来判定输入数据是否存在异常。本发明在效率以及效果上均获得不错的表,为基于深度学习的异常检测系统提供一种新的框架。
-
公开(公告)号:CN115272688A
公开(公告)日:2022-11-01
申请号:CN202210919656.8
申请日:2022-08-02
Applicant: 大连理工大学
IPC: G06V10/42 , G06V10/44 , G06V10/74 , G06V10/764 , G06V10/774
Abstract: 本发明公开了一种基于元特征的小样本学习图像分类方法,属于小样本学习图像分类领域。用于在只有少量有标签的图像样本场景,能够很好的完成分类任务。由于在度量图像特征表示之间的相似性时,会存在背景因素的干扰,导致分类准确率较差,同时在细粒度的任务中,由于样本量过少导致无法容易得区分两个相似类别的样本。所以本发明基于这个因素,提出了基于元特征的小样本学习方法,即在学习得到图像特征表示时,同时考虑到全局特征表示和局部特征表示,建立一个自适应调节的网络,让网络模型在粗细粒度的任务中,能根据任务调整对图像全局特征和局部特征的关注度。实验证明,本发现的方法相比传统方法能取得更好的结果。
-
公开(公告)号:CN107357763B
公开(公告)日:2020-08-14
申请号:CN201710433595.3
申请日:2017-06-12
Applicant: 大连理工大学
Abstract: 本发明公开了一种基于自步学习的众包分类数据质量控制方法,属于计算机科学数据挖掘技术领域。用于多分类众包标注任务的真实分类发现,以及恶意工作者识别。首先,方法根据初始数据集性质计算样本可信度,然后选择样本,然后计算真实标签以及工作者能力,接着根据更新的能力和真实标签重新选择样本然后,在完全选择到全部的样本点之后,进一步优化,最终同时获取标注真实答案以及工作者的能力与恶意与消极工作者识别结果。实验证明,本发现的方法相比传统方法能取得更好的结果。
-
公开(公告)号:CN107316081A
公开(公告)日:2017-11-03
申请号:CN201710434213.9
申请日:2017-06-12
Applicant: 大连理工大学
IPC: G06N99/00
Abstract: 本发明公开了一种基于极限学习机的不确定数据分类方法。UELM方法使用概率密度函数对不确定数据进行建模,这种做法有效避免了期望值和抽样点方法带来的不确定数据的概率分布信息丢失问题。而且,UELM方法重新设计了传统的极限学习机方法框架,修改了输入层的接受数据以及隐藏层的激活函数,这样的改进使得极限学习机方法更加适用于不确定数据。整个UELM方法分成初始化、训练和预测三个阶段。初始化阶段用于实验参数的生成,训练阶段通过对实验数据的学习过程得到学习结果,预测阶段通过使用训练阶段学习得到的结果对新数据进行分类。大量的实验结果表明UELM方法在准确率和时间效率上相对于其他不确定数据分类方法都有突出表现。
-
公开(公告)号:CN113591879B
公开(公告)日:2024-10-29
申请号:CN202110831409.8
申请日:2021-07-22
Applicant: 大连理工大学
IPC: G06V10/44 , G06V10/74 , G06V10/762 , G06V10/77 , G06V10/82 , G06N3/04 , G06N3/0895
Abstract: 本发明公开了基于自监督学习的深度多视图聚类方法、网络、装置及存储介质,属于深度多视图聚类领域,应用于异常点检测、多种产品的价值组合和目标用户的群体划分等多种应用场景,该方法使用了一种自监督的成对约束传播模型,通过融合的自编码器提取多个视图的潜在一致特征后基于多视图的共性特征可以自动地从数据中挖掘监督约束信息,随后用于优化聚类特征提取模型,充分地挖掘了数据的潜在价值,有效地降低了人工标记的成本同时提升了多视图聚类的性能,实验证明,本发明提出的方法相比现存的基准算法能取得更好的结果。
-
公开(公告)号:CN107330798A
公开(公告)日:2017-11-07
申请号:CN201710412366.3
申请日:2017-06-05
Applicant: 大连理工大学
IPC: G06Q50/00
Abstract: 本发明公开了一种基于种子节点传播的社交网络间用户身份识别方法,属于社交网技术领域。应用于广告推荐,合并通讯录和网络安全等多个领域。该方法使用了一种种子节点扩张的传播模型,可以迭代地在种子节点周围逐步发现越来越多的匹配的节点对,同时充分考虑了用户的属性信息,好友链接信息和社交行为的信息,有效的实现了社交网络间身份识别方法。采用本发明提出的身份识别方法,识别准确率达到了85%,召回率达到了61%,F1值达到了71%,优于现存的基准算法。
-
-
-
-
-
-
-
-
-