-
公开(公告)号:CN119169330A
公开(公告)日:2024-12-20
申请号:CN202411305962.8
申请日:2024-09-19
Applicant: 杭州电子科技大学
IPC: G06V10/762 , G06V10/44 , G06N3/0464 , G06N3/088 , G06N3/084 , G06N3/0895
Abstract: 本发明公开了一种基于特征适配器的瓷砖表面缺陷检测与定位方法,包括如下步骤:获取图像数据集;任意选取一张图像作为输入,通过一个预训练编码器提取图像特征表示;将提取的特征表示通过一个特征适配器进行图像的坐标位置嵌入得到位置增强的可学习特征;所述可学习特征通过MiniBatchKMeans进行大规模数据聚类从而进行内存库初始化;通过损失函数进行监督训练对特征适配器进行优化,应用优化的特征适配器的输出更新记忆库;计算该图像的最新表示与融合特征之间的距离来获得异常分数。该方法通过同时更新特征适配器和记忆库,以得到当前最具判别性的特征,实现实时、高效的缺陷检测与定位。
-
公开(公告)号:CN113743189B
公开(公告)日:2024-02-02
申请号:CN202110726048.0
申请日:2021-06-29
Applicant: 杭州电子科技大学
IPC: G06V40/20 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于分割引导的人体姿态估计方法。本发明采用HRNet人体姿态估计的基本网络结构;HRNet包含4个阶段3个分支,每个分支捕获输入信号的不同尺度特征表示;每个阶段不同分支的特征会进行相互融合并将融合后的特征作为下一个阶段的输入;同时高分辨率分支的每一个阶段都融入一个分割引导机制,得到一个分割引导的HRNet;利用分割引导机制来逐步改善每个阶段产生的检测结果。结果表明,本发明具有更好的鲁棒性和自适应能力。解决了原来复杂背景的干扰问题。人体姿态估计是行为识别的上游任务对其至关重要,准确高效的人体姿态估计可以促进人体行为识别的准确度。
-
公开(公告)号:CN116842954A
公开(公告)日:2023-10-03
申请号:CN202310807334.9
申请日:2023-07-04
Applicant: 杭州电子科技大学
IPC: G06F40/295 , G06F40/126 , G06F40/30
Abstract: 本发明公开了一种基于预训练模型的部分标签命名实体识别方法,包括如下步骤:将预测语句输入到整体模型里,得到部分实体词汇和实体类型标签;将部分实体词汇拼接在原始的预测语句中的输入末端组合成字词序列,并得到字词序列对应的头、尾位置序列和字词标签;将得到的实体词token序列和字词标签序列分别通过部分标签小模型中的BERT进行序列编码得到对应序列编码向量后进行拼接得到融合后的特征向量;将得到的特征向量通过部分标签小模型中的transformer特征提取器结合相对应的位置编码进行特征融合得到最终特征向量表示;使用得到的融合特征通过CRF进行标签预测和解码。该方法采用预训练大模型+小模型的方式代替外部词典信息,能有效的进行命名实体识别抽取。
-
公开(公告)号:CN111709294B
公开(公告)日:2023-07-14
申请号:CN202010419503.8
申请日:2020-05-18
Applicant: 杭州电子科技大学
IPC: G06V40/10 , G06V20/52 , G06V10/44 , G06V10/764 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于多特征信息的快递人员身份识别方法。本发明提出利用跳跃连接的方式连接3个含有相同大小卷积核的卷积层与3个多尺度金字塔模块MSPM,来融合多层高层语义特征信息和低层特征图的细节信息,从而构建目标检测网络SFPNet。其中,MSPM采用并行的空洞卷积来提取不同尺度物体对应的特征信息,这些空洞卷积中含有不同大小空洞率,在卷积过程中采用不同步长。本发明在得到快递人员相关信息后,将多个目标信息进行综合评定,判读更加准确,鲁棒性和自适应能力更好。
-
公开(公告)号:CN115082542A
公开(公告)日:2022-09-20
申请号:CN202210746044.3
申请日:2022-06-29
Applicant: 杭州电子科技大学
Abstract: 针对裂缝在隧道上的普遍性和危害性,以及传统手工测量的低效性,本文提出的方法可以直接应用在机器拍摄的隧道裂缝图片上,能够快速的给出裂缝的最大长度、所有长度。为实现以上的技术目的,本发明提供一种基于图论的隧道裂缝长度测量方法,包括以下步骤:步骤一,将待测量的原裂缝图像转化为为灰度图;步骤二,在灰度图的基础上进行高斯平滑滤波;步骤三,对平滑后的灰度图进行图像二值化;步骤四,提取二值化图像的裂缝中线骨架;步骤五,消除中线骨架中存在的细小毛刺;步骤六,对中线骨架进行修复,将断触处连接起来;步骤七,对步骤六的结果图进行消除非裂缝区域的噪声;步骤八,通过最终的中线骨架,求裂缝总长度,求裂缝最大长度。
-
公开(公告)号:CN113139378B
公开(公告)日:2022-02-18
申请号:CN202110292545.4
申请日:2021-03-18
Applicant: 杭州电子科技大学
IPC: G06F40/258 , G06V10/40 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于视觉嵌入和条件归一化的图像描述方法。本发明提出了一种基于transformer模型的网络,被称为V‑CLTM。在transformer模型的输入端,使用关键词嵌入模块(KEM)提取图像中的目标类别作为关键词,结合文本序列作为输入序列;使用视觉嵌入模块(VEM)用来提取图像特征,并将特征编码成transformer的归一化层能接受维度作为条件输入;同时,本发明提出的条件归一化的LN层是一种通过视觉嵌入来调节模型进行特征选择的有效机制,将条件归一化LN应用于transformer上。结果表明,这种方法具有更好的鲁棒性和自适应能力。
-
公开(公告)号:CN111507183B
公开(公告)日:2021-02-02
申请号:CN202010167699.6
申请日:2020-03-11
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于多尺度密度图融合空洞卷积的人群计数方法。本发明步骤如下:获取人群图像数据集,并且进行预处理;建立基于多尺度密度图融合空洞卷积的人群计数网络;将预处理之后的人群图像输入该人群计数网络中提取特征数据,输出对应图像的低分辨率密度图;将低分辨率密度图融合空洞卷积网络,输出对应图像的高分辨率密度图;对人群计数网络输出的高分辨率密度图进行积分,得到对应人群图像中的人群总数;将最后输出的高分辨率密度图与人工标注的真实密度图进行损失计算,不断迭代更新人群计数网络;将测试图片输入最终确认的人群计数网络,生成人群分布密度图并且进行人群计数。本发明具有很好的自适应能力和很高的预测精度。
-
公开(公告)号:CN111507101B
公开(公告)日:2020-12-15
申请号:CN202010141031.4
申请日:2020-03-03
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于多层次语义胶囊路由的反讽检测方法。本发明步骤:使用GloVe对网络评论和上下文进行词向量嵌入,分别获得网络评论和上下文的文本特征;并将文本特征输入到Transformer模型中进行向量的转换,分别获得网络评论和上下文的隐藏层特征;通过CNN把网络评论的隐藏层特征转化为网络评论的池化特征;把池化特征作为权重使用注意力机制对上下文的隐藏层特征进行权重偏移,获得新的隐藏层特征Ⅰ;把网络评论的隐藏层特征与SenticNet中获得的情感权重相结合,获得新的隐藏层特征Ⅱ;把隐藏层特征Ⅰ和Ⅱ作为低层次的语义胶囊,进行EM路由获得高层次的语义胶囊;最后把高层次的语义胶囊通过SoftMax函数获得最后的分类结果。本发明有效解决了反讽检测分类效果不佳等问题。
-
公开(公告)号:CN111353029B
公开(公告)日:2020-09-22
申请号:CN202010109598.3
申请日:2020-02-22
Applicant: 杭州电子科技大学
IPC: G06F16/332 , G06F16/35 , G06N3/04 , G06N3/08 , G06F40/30
Abstract: 本发明公开了一种基于语义匹配的多轮对话口语理解方法。本发明利用基于词级别的attention卷积神经网络和树状循环神经网络联合提取语句语义信息,并通过语义匹配对历史语句进行合理的权重值分配,结合上述产生的历史语句语义表示和对应的权重值,输入对应角色双向LSTM模型得到角色历史影响向量,结合2个角色历史影响向量得到最终历史语义影响向量,结合该向量对当前语句做意图检测,并通过损失函数优化模型参数结构。这种方法具有更好的鲁棒性和自适应能力。其中具体发明的基于语义匹配的多轮对话口语理解模型训练流程图如图2。
-
公开(公告)号:CN111625652A
公开(公告)日:2020-09-04
申请号:CN202010618782.0
申请日:2020-06-30
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于多路动态掩码的注意力神经网络的方法本发明包括如下步骤:步骤(1)采集自然语言推理数据并做预处理;步骤(2)动态掩码选择器根据句子的词向量表示来生成动态掩码;步骤(3)使用四种动态注意力机制提取句子特征;步骤(4)重复步骤(1)至步骤(3)分别生成前提句和假设句的句子表示向量,利用蕴含分类器输出推理结果。本发明利用多路动态掩码的注意力神经网络对文本数据进行分析,通过非人工干预的手段生成不同的句子向量,并通过积分求出最终的结果,这种方法具有更好的鲁棒性和自适应能力。
-
-
-
-
-
-
-
-
-