一种基于卷积神经网络对图像中的铅笔进行精确计数的方法

    公开(公告)号:CN111369503B

    公开(公告)日:2023-05-26

    申请号:CN202010115736.9

    申请日:2020-02-25

    Applicant: 东南大学

    Inventor: 蒋业凡 夏思宇

    Abstract: 本发明公开了一种基于卷积神经网络对图像中的铅笔进行精确计数的方法,该方法首先搭建YOLO神经网络模型;对生产线上俯拍采集的多种不同类型的铅笔图片进行预处理,作为训练数据;通过对YOLO神经网络进行训练,得到网络的权重和偏置;将待计数的铅笔图像作为神经网络模型的输入,获得出铅笔的精确数目。铅笔形状有六边形和圆形,笔芯形状有圆形和三角形,笔芯颜色有红色、绿色、蓝色、黄色、黑色等多种。由于笔芯裸露在外,笔芯形状和铅笔形状相似,因此传统图像处理方法,包括二值化处理后进行形态学操作等不适用于这种类型的铅笔。通过深度学习的方法,构建YOLO神经网络模型可以对这种类型的铅笔进行精确计数,准确率可大大提升。

    一种基于空间约束的人脸图像风格化方法

    公开(公告)号:CN109829353B

    公开(公告)日:2023-04-18

    申请号:CN201811389750.7

    申请日:2018-11-21

    Applicant: 东南大学

    Inventor: 郑程耀 夏思宇

    Abstract: 本发明公开了一种基于空间约束的人脸图像风格化方法,该方法包括如下步骤,首先,将输入的风格图像和原始图像进行归一化,通过特征编码器提取人脸的多层深度特征图,并通过人脸建模网络提取人脸空间特征点;然后,在深度特征图的每一层,利用人脸空间特征点的空间约束和普氏变换,执行特征块匹配方法,获得从风格图像到原始图像的映射;将映射后的风格图像与原始图像进行特征融合得到新的深度特征图,通过预先训练的特征解码器,最终获得风格化的原始图像。本发明属于计算机视觉领域,充分利用了人脸的空间对应关系,设计出快速的特征块匹配方法,能有效提升人脸图像风格化的速度和准确性。

    一种企业领域分类及企业关键词筛选方法

    公开(公告)号:CN109101477B

    公开(公告)日:2023-01-31

    申请号:CN201810563448.2

    申请日:2018-06-04

    Applicant: 东南大学

    Inventor: 邝野 夏思宇 李钢

    Abstract: 本发明公开了一种企业领域分类及企业关键词筛选方法,该方法通过对企业领域语料库进行训练得出相关领域的特征词汇作为分类词典,然后利用这种分类词典对企业的简介文档进行行业分类,在分类之后,本方法还能从企业的简介文档中提取出能代表这个企业所从事领域的行业标签。此外,本方法能克服中文文本处理中的大多数噪声词影响,行业分类错误率低,分类效率高,综合表现性能优异。

    一种基于深度学习的通用椭圆目标检测方法

    公开(公告)号:CN115049848A

    公开(公告)日:2022-09-13

    申请号:CN202210768594.5

    申请日:2022-07-01

    Applicant: 东南大学

    Inventor: 王田浩 夏思宇

    Abstract: 本发明公开了一种基于深度学习的通用椭圆目标检测方法,该方法包括:构建通用椭圆目标检测器;建立基于Anchor‑free目标检测的卷积神经网络结构;使用通用椭圆目标检测数据集训练建立好的卷积神经网络的参数;将待检测图片输入到训练好的卷积神经网络中检测,输出检测结果图。本发明通过Anchor‑free目标检测卷积神经网络能够实现自动、准确地对任意椭圆目标进行检测和定位。

    基于多层级特征选择卷积神经网络的遥感目标检测方法

    公开(公告)号:CN112766184A

    公开(公告)日:2021-05-07

    申请号:CN202110090408.2

    申请日:2021-01-22

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于多层级特征选择卷积神经网络的遥感目标检测方法,该方法首先搭建卷积神经网络模型,并对搭建的卷积神经网络结构参数进行设定和训练参数初始化;再对训练图像进行预处理和标签格式转化,然后预处理和标签格式转化的训练图像进行数据增强;进行卷积神经网络模型训练,得到网络权重和偏置;将测试图像输入训练好的神经网络模型,得到定位和分类结果。由于基于水平框的目标识别对紧密排列的旋转物体无法正确定位,同时按目标尺寸大小进行特征分类的方式过于简单而存在问题,通过本发明公开的多层级特征选择卷积神经网络的方法可以实现任意方向物体的识别以及分类,并大大提高准确率。

    一种基于深度学习的睡眠分期方法

    公开(公告)号:CN111783534A

    公开(公告)日:2020-10-16

    申请号:CN202010466274.5

    申请日:2020-05-28

    Applicant: 东南大学

    Inventor: 胥凯林 夏思宇

    Abstract: 本发明公开一种基于深度学习的睡眠分期方法,该方法包含以下步骤:对单通道脑电信号进行过采样获得数据集;设计用于睡眠分期的卷积神经网络;在过采样后的数据集上预训练,并根据贝叶斯优化调整模型的超参数;设计惩罚权重损失函数对模型二次优化;利用训练好的模型测试输入的单通道脑电信号得到预测的睡眠时期。本发明方法无需额外的提取特征就可以让神经网络学习到睡眠分期信息,利用该方法可以有效的避免由数据集不平衡引起的各时期平均识别率低下的问题。该方法可被广泛应用于存在数据集不平衡的场景,如心电图检测心律不齐和脑电图检测癫痫。

    一种基于表情、语音和眼动特征的多模态测谎方法

    公开(公告)号:CN110969106A

    公开(公告)日:2020-04-07

    申请号:CN201911163791.9

    申请日:2019-11-25

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于表情、语音和眼动特征的多模态测谎方法,包括:获取表情、眼动特征、语音的数据并进行音视频分离、去噪等预处理,处理后分别送入表情情感识别模块、语音情感识别模块和眼动特征识别模块进行分析得到从表情、声音、眼部特征分别得到的情感特征,通过将三个模态的情感结合作为情感特征送入训练好的分类模型进行测谎,最终得到综合测谎结果。本发明通过多模态的情感分类能更加准确的实现测谎。

    一种基于视线跟踪的测谎方法

    公开(公告)号:CN110659674A

    公开(公告)日:2020-01-07

    申请号:CN201910837835.5

    申请日:2019-09-05

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于视线跟踪的测谎方法,主要运用人脸检测技术和瞳孔中心定位算法来追踪人眼瞳孔及其眼动轨迹,根据视频的眼动轨迹预测其是否说谎。首先我们对视频中每一帧图像进行人脸区域检测,同时保存面部特征,得到双眼中心位置参数;然后进行瞳孔中心定位和坐标获取,将每一帧的瞳孔位置保存下来;然后使用每一帧的瞳孔位置数据计算眼动轨迹的参数,通过计算瞳孔位移的幅度和角度参数得到视频的特征向量;然后对特征向量数据集进行预处理,进行降噪和归一化处理;将处理好的数据输入SVM支持向量机,训练能够判断是否说谎的二分类预测模型;最后通过加载训练好的预测模型得到预测结果。

    一种基于图像计算铅笔精确数目的方法

    公开(公告)号:CN110473174A

    公开(公告)日:2019-11-19

    申请号:CN201910682612.6

    申请日:2019-07-26

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于图像计算数万铅笔精确数目的方法,该方法基于Matlab图像处理技术利用生产线上俯拍采集获得的数万支铅笔图片进行检测计算处理,计算出铅笔的精确数目。铅笔形状包括六边形、正方形和三角形等。先对图片进行分割处理,将大图片切割为同等大小的小图片,对每个小图片分别进行如下处理:获得图片灰度直方图,并选取灰度直方图中最高峰两边的谷底作为图片二值化阈值,利用此阈值对图片进行二值化处理;然后进行图像腐蚀;若图像腐蚀过后的图片存在不同铅笔区域之间有联通情况,针对不同图片的需要利用构造结构元素进行形态学开操作;最后对处理完成的图片进行连通域个数计算;然后将所有分块图片得到的结果相加得到全局铅笔个数。

    一种基于前景分割图的人群密度估计方法

    公开(公告)号:CN110276264A

    公开(公告)日:2019-09-24

    申请号:CN201910446452.5

    申请日:2019-05-27

    Applicant: 东南大学

    Inventor: 徐浩 夏思宇

    Abstract: 本发明公开了一种基于前景分割图的人群密度估计方法,该方法包含以下步骤:标注每张图的人头获得点标记图;基于点标记图利用高斯平滑方法得到人群密度图;基于密度图利用阈值分割的方法获得人群前景分割图;分别设计用于图像特征提取的神经网络,用于人群密度回归的神经网络分支,和用于人群前景分割的神经网络分支,最后将两个网络分支的输出融合得到最终输出;制作训练集,训练模型;利用训练好的模型测试输入图像得到人群密度估计结果。本发明方法无需额外的标记信息就可以让神经网络学习到前景分割信息,利用该方法可以有效的避免复杂背景的误检问题。

Patent Agency Ranking