融合时序卷积与Transformer编码器的中文命名实体识别方法

    公开(公告)号:CN114169330B

    公开(公告)日:2023-07-14

    申请号:CN202111399845.9

    申请日:2021-11-24

    Inventor: 孙俊

    Abstract: 融合时序卷积与Transformer编码器的中文命名实体识别方法,属于文字识别领域。首先,采用前人提出的扁平晶格结构对字符和单词特征进行建模,并将在Transformer编码器中绝对位置编码改为相对位置编码来避免方向信息的丢失。其次,使用TCN加强网络模型对位置信息的捕捉,获取更多局部上下文语义关系。最后,采用R‑Drop策略对模型的输出分布进行正则约束,防止模型过拟合,提高模型的泛化能力。实验结果表明,所提模型在Weibo数据集和MSRA数据集上的F1值分别达到61.18%和94.48%,均优于传统模型和基准模型,验证了其在中文命名实体识别的上优越性。

    人体姿态估计模型训练方法、估计方法、装置及电子设备

    公开(公告)号:CN117037215B

    公开(公告)日:2024-03-22

    申请号:CN202311028070.3

    申请日:2023-08-15

    Inventor: 孙俊 向欢

    Abstract: 本发明涉及人体姿态估计技术领域,具体公开了一种人体姿态估计模型训练方法、估计方法、装置及电子设备,包括:获取训练数据集,所述训练数据集包括原始图像和标注数据,所述标注数据包括与所述原始图像对应的标注人体边界框和标注关键点数据;将所述原始图像输入至人体姿态估计网络结构,获得与所述原始图像对应的预测数据,所述预测数据包括预测人体边界框和预测关键点数据,所述人体姿态估计网络结构根据目标检测算法获得;根据所述预测数据及所述标注数据对所述人体姿态估计网络结构进行优化训练,获得人体姿态估计模型。本发明提供的人体姿态估计模型训练方法能够保证准确性的同时降低计算量。

    图像字幕自动生成方法、装置及存储介质

    公开(公告)号:CN116665012A

    公开(公告)日:2023-08-29

    申请号:CN202310680080.9

    申请日:2023-06-09

    Inventor: 孙俊 高增

    Abstract: 本发明涉及自然语言处理技术领域,具体公开了一种图像字幕自动生成方法、图像字幕自动生成装置及计算机存储介质,包括:获取待生成字幕图像,并对所述待生成字幕图像进行处理获得向量图像特征;将所述向量图像特征输入至编码器以进行先验知识构建,并获得图像有效特征;将所述图像有效特征输入至解码器以使得所述图像有效特征与图像描述文本之间进行多模态交互,获得交互结果;根据所述交互结果生成文本序列;对所述文本序列进行转换处理获得图像字幕,并输出所述图像字幕。本发明提供的图像字幕自动生成方法能够降低图像字幕与图像实际内容表达之间的偏差。

    图像字幕自动生成方法、装置及存储介质

    公开(公告)号:CN116665012B

    公开(公告)日:2024-02-09

    申请号:CN202310680080.9

    申请日:2023-06-09

    Inventor: 孙俊 高增

    Abstract: 本发明涉及自然语言处理技术领域,具体公开了一种图像字幕自动生成方法、图像字幕自动生成装置及计算机存储介质,包括:获取待生成字幕图像,并对所述待生成字幕图像进行处理获得向量图像特征;将所述向量图像特征输入至编码器以进行先验知识构建,并获得图像有效特征;将所述图像有效特征输入至解码器以使得所述图像有效特征与图像描述文本之间进行多模态交互,获得交互结果;根据所述交互结果生成文本序列;对所述文本序列进行转换处理获得图像字幕,并输出所述图像字幕。本发明提供的图像字幕自动生成方法能够降低图像字幕与图像实际内容表达之间的偏差。

    基于Transformer的X线胸片自动诊断与新冠感染区分割方法

    公开(公告)号:CN114170232B

    公开(公告)日:2024-01-26

    申请号:CN202111461101.5

    申请日:2021-12-02

    Inventor: 孙俊

    Abstract: 基于Transformer的X线胸片自动诊断与新冠感染区分割方法,属于图像处理领域。该网络由双路嵌入层、Transformer模块、图像分割解码器三部分组成。双路嵌入层通过两种方式编码图像特征——二维卷积和ResNet34网络前四层,分别输出X线胸片浅层直观特征和深层抽象特征。Transformer模块是整个网络的核心,通过它,网络综合考虑了图片的局部特征与全局特征,深层抽象特征与浅层高级特征。分割解码器用于输出新冠肺部感染区的分割结果。网络使用一种不确定性损失以动态平衡分类与分割任务。分类损失函数是分类对比损失函数和交叉熵损失的和,分割损失使用的是二分类的交叉熵损失。

    基于动态梯度和多视图协同注意力的多模态情感分析方法

    公开(公告)号:CN116204850B

    公开(公告)日:2023-11-03

    申请号:CN202310257670.0

    申请日:2023-03-14

    Inventor: 孙俊 王香

    Abstract: 本发明涉及情感分析技术领域,具体公开了一种基于动态梯度和多视图协同注意力的多模态情感分析方法,包括:获取具有情感信息的多模态数据;将多模态数据输入至多模态情感分析模型,获得情感分析结果,其中多模态情感分析模型的训练包括:将训练集数据进行模态表示学习以获得浅层学习特征;将浅层学习特征进行特征融合处理获得深层融合特征,以及进行动态梯度调节处理以获得梯度调节参数;根据深层融合特征进行模型预测以获得训练结果;根据验证集数据以及测试集数据重复上述训练过程,以获得多模态情感分析模型。本发明提供的基于动态梯度和多视图协同注意力的多模态情感分析方法在进行情感分析时能够既关注模态之间交互又能关注模态之间的平衡。

    基于关键点与旁路矫正的车牌识别方法、装置及存储介质

    公开(公告)号:CN116958954A

    公开(公告)日:2023-10-27

    申请号:CN202310935114.4

    申请日:2023-07-27

    Inventor: 孙俊 杨震南

    Abstract: 本发明涉及智能交通技术领域,具体公开了一种基于关键点与旁路矫正的车牌识别方法、装置及存储介质,包括:获取待检测车牌图像;将所述待检测车牌图像进行预处理后输入至车牌检测网络,获得车牌区域检测图像和车牌关键点预测结果;根据所述车牌关键点预测结果对所述车牌区域检测图像进行第一次矫正,获得车牌第一次矫正图像;将所述车牌第一次矫正图像输入至车牌识别网络进行第二次图像矫正后,获得车牌字符预测结果。本发明提供的基于关键点与旁路矫正的车牌识别方法能够提升车牌检测精度。

    文本纠错模型训练方法、文本纠错方法、设备及存储介质

    公开(公告)号:CN116579327B

    公开(公告)日:2023-09-26

    申请号:CN202310863192.8

    申请日:2023-07-14

    Inventor: 孙俊 田志豪

    Abstract: 本发明涉及文本纠错技术领域,具体公开了一种文本纠错模型训练方法、文本纠错方法、设备及存储介质,包括:获取训练数据集;对所述训练数据集进行预处理获得输入序列;根据输入序列对初始纠错模型进行训练,获得输入序列中每个字符的预测概率,预测概率表示每个字符被预测为该字符所对应的候选集中其他字符的概率,每个字符均对应一个候选集,候选集包括与所对应的字符具有多模态关联特征的字符的集合;根据每个字符的预测概率构建该字符对应的负样本数据集,并确定该字符对应的正样本;根据负样本数据集和正样本对初始纠错模型进行优化,获得目标纠错模型。本发明提供的文本纠错模型训练方法能够提高文本纠错的准确度。

    轴承故障诊断方法、装置及电子设备

    公开(公告)号:CN116721097A

    公开(公告)日:2023-09-08

    申请号:CN202310988474.0

    申请日:2023-08-08

    Inventor: 孙俊 苗霖

    Abstract: 本发明涉及轴承故障诊断技术领域,具体公开了一种轴承故障诊断方法、装置及电子设备,包括:获取待识别轴承故障数据;对待识别轴承故障数据进行预处理,获得轴承故障频域数据;将轴承故障频域数据输入至轴承故障诊断模型中进行识别,以获得故障类别识别结果,其中轴承故障诊断模型是基于轴承故障训练数据集及轴承故障训练数据集所对应的轴承故障类别训练得到的;轴承故障诊断模型能够对轴承故障频域数据进行傅里叶变换以提取轴承故障特征,并根据轴承故障特征进行识别,获得故障类别识别结果;对故障类别识别结果进行后处理,并输出后处理的故障类别识别结果。本发明提供的轴承故障诊断方法能够有效提升轴承故障诊断的准确性。

    候选实体生成方法、装置、存储介质及电子设备

    公开(公告)号:CN116306504A

    公开(公告)日:2023-06-23

    申请号:CN202310582057.6

    申请日:2023-05-23

    Inventor: 孙俊 龙斌

    Abstract: 本发明涉及实体链接技术领域,具体公开了一种候选实体生成方法、装置、存储介质及电子设备,包括:根据训练好的孪生BERT模型编码器将知识库中的所有实体均编码为向量,获得知识库实体向量空间;获取待生成候选实体的实体指称项及其上下文文本,并根据训练好的孪生BERT模型编码器对待生成候选实体的实体指称项及其上下文文本均进行编码获得目标向量;在知识库实体向量空间中检索获得与目标向量近邻的k个向量;将知识库实体向量空间中的k个向量所对应的实体作为候选实体;其中所述孪生BERT模型编码器为根据正样本数据集、负样本数据集和知识库进行训练获得。本发明提供的候选实体生成方法获得的实体链接结果准确性高。

Patent Agency Ranking