一种基于Swin Transformer的花粉分类方法

    公开(公告)号:CN119445188A

    公开(公告)日:2025-02-14

    申请号:CN202411286817.X

    申请日:2024-09-13

    Abstract: 一种基于Swin Transformer的花粉分类方法,获取花粉图像,并进行标注;构建分类模型,包括条形卷积缩放模块、骨干网络、全连接层和分类头;条形卷积缩放模块用于将输入的花粉图像进行缩放;骨干网络基于Swin Transformer编码器,分为级联的四个阶段,用于采集花粉图像中的花粉特征,其中,在第一阶段和第二阶段,阶段的输入特征均分别经过窗口多头自注意力模块和大视野空间双边注意力模块,再融合后经过移位窗口多头自注意力模块,得到阶段的输出特征;第四阶段输出最终的花粉特征;所述全连接层和分类头基于所述最终的花粉特征进行分类;训练所述分类模型,并利用训练完成的分类模型进行花粉分类。

    基于关键点检测的羊脸对齐与识别方法和系统

    公开(公告)号:CN118053173A

    公开(公告)日:2024-05-17

    申请号:CN202410062676.7

    申请日:2024-01-16

    Abstract: 本发明公开了一种基于关键点检测的羊脸对齐与识别方法和系统,方法包括:采集羊脸面部数据,羊脸面部数据包括面部关键点被遮挡和均未被遮挡的图像;在各图像中通过人工方式标注出羊脸位置以及未被遮挡的面部关键点位置,并将数据分为测试集和训练集;检测得到羊脸面部在图像中的具体位置;构建关键点检测模型,检测面部关键点;当检测到面部关键点均未被遮挡,采用以两眼连线中心为基准的羊脸对齐算法进行羊脸对齐;当检测到面部关键点被遮挡,采用以四点连线交叉反向延伸中心为基准的羊脸对齐算法进行羊脸对齐。本发明解决了面部关键点受到遮挡的问题,可实现羊脸精确识别。

    基于蒙古语格成分掩码数据增强的蒙汉神经机器翻译方法

    公开(公告)号:CN117291194A

    公开(公告)日:2023-12-26

    申请号:CN202311180085.1

    申请日:2023-09-13

    Abstract: 一种基于蒙古语格成分掩码数据增强的蒙汉神经机器翻译方法,结合蒙古语的语法规则进行蒙古语格成分分析与标注;采用不同的掩码方法对蒙古语格成分进行掩码数据增强,同时以源端和目标端为条件预测被掩码的词;通过语义编码器将汉语和数据增强后的蒙古语的语义信息映射在同一个向量空间,并生成包含多个具有相似语义的蒙古语和汉语的向量表示的邻接语义区域;在该区域中对样本采样,使用广播网络集成到翻译模型的解码器进行解码;翻译模型采用Transformer‑XL模型,在进行解码时,将每个解码器模块的输出动态结合在一起;将原样本与数据增强后的样本一同训练,并利用训练好的翻译模型进行蒙汉机器翻译。本发明可扩充训练语料规模,提升翻译质量。

    一种基于显著性特征的彩色图像颜色转移方法

    公开(公告)号:CN116704050A

    公开(公告)日:2023-09-05

    申请号:CN202310767459.3

    申请日:2023-06-27

    Abstract: 一种基于显著性特征的彩色图像颜色转移方法,分别获得原始图像的显著性特征图和参考图像的显著性特征图;根据显著性特征图阈值处理,将原始图像划分为显著性区域和非显著性区域,将参考图像划分为显著性区域和非显著性区域;在显著性区域和非显著性区域,分别根据方差和显著性值的加权平均值,将参考图像的颜色信息转移到输入图像,本发明能够进一步提高彩色图像颜色转移的效果。

    一种基于Conformer和MelGAN的蒙古语语音合成方法

    公开(公告)号:CN116682413A

    公开(公告)日:2023-09-01

    申请号:CN202310851534.4

    申请日:2023-07-12

    Abstract: 一种基于Conformer和MelGAN的蒙古语语音合成方法,获取蒙古语文本数据,提取文本特征,将文本特征编码转换为音素序列,并将所述音素序列输入至BERT预训练模型;利用BERT预训练模型训练蒙古文音素信息,学习发音中的韵律特征,并将音素信息对齐;利用基于轻量级Conformer模块的FastSpeech2声学模型,通过音素信息并行生成声学特征,即Mel频谱图;利用基于GAN的轻量级模型MelGAN作为声码器,在其中添加蒙古语语音特征,将Mel频谱图推理转换为语音波形,从而实现蒙古语语音合成,本发明可提高蒙古语语音合成的速度与合成语音的自然度。

    面向色盲的照明光谱获取方法、装置及设备

    公开(公告)号:CN110967112B

    公开(公告)日:2022-05-10

    申请号:CN201911266023.6

    申请日:2019-12-11

    Abstract: 本申请涉及一种面向色盲的照明光谱获取方法、装置及设备,方法包括:首先获取目标物体的表面反射率;然后根据所述表面反射率和预设照明光谱得到所述目标物体在所述预设照明光谱下的特殊光照三刺激值;再利用预设评价函数对所述特殊光照三刺激值进行评价,得到评价结果;当所述评价结果为满足预设条件时,将所述预设照明光谱输出为目标光谱;当所述评价结果为不满足预设条件时,更新所述预设照明光谱。基于此,便可以利用评价函数得到满足预设条件的目标光谱。

    基于指针生成网络实现占位符消歧的蒙汉机器翻译方法

    公开(公告)号:CN112395892B

    公开(公告)日:2022-03-18

    申请号:CN202011393623.1

    申请日:2020-12-03

    Abstract: 一种基于指针生成网络实现占位符消歧的蒙汉机器翻译方法,基于编码器‑解码器架构,其特征在于,还包括辅助网络和骨干网络,所述辅助网络为每个输入源词汇位置生成一个二进制门,动态地选择要关注的词汇,所述骨干网络为带有门控机制的注意力的指针生成网络;编码阶段,经编码器的词嵌入层,将源文编码成一个隐藏层状态,再由所述门控机制决定来自当前状态的信息是流入还是被占位符替换;解码阶段,利用指针生成网络复制源文能力和生成新词汇能力,搭配占位符上下文语境进行消歧,给出符合上下文语义的精准词义,在最后数据输出前,利用附加模块进行语言学检查,检测到可能翻译异常的情况做出标注,通过调整相关参数以达到最好的翻译效果。

Patent Agency Ranking