一种大规模极弱监督多标签政策分类方法及系统

    公开(公告)号:CN116127078A

    公开(公告)日:2023-05-16

    申请号:CN202310416484.7

    申请日:2023-04-19

    Applicant: 吉林大学

    Abstract: 本发明公开了一种大规模极弱监督多标签政策分类方法及系统,包括以下步骤:基于未标记政策语料库对WoBERT进行连续的预训练,获得政策领域专用的语言模型;利用所述政策领域专用的语言模型,从所述未标记政策语料库中学习与标签名称语义相关的种子词,并为每个类别种子词构建种子词汇表;利用所述种子词汇表中的类别种子词信息,为未标记的政策生成伪标签,并将带有伪标签的政策添加到伪训练集中;利用所述伪训练集对所述政策领域专用的语言模型进行训练,利用训练好的所述政策领域专用的语言模型为政策进行编码操作,完成多标签政策分类。本发明利用用户提供标签名称,而不是使用任何的标记文档,来对海量的政策数据进行分类。

    一种基于多模态大模型的家务助理机器人

    公开(公告)号:CN118456455B

    公开(公告)日:2024-11-15

    申请号:CN202410924776.6

    申请日:2024-07-11

    Applicant: 吉林大学

    Abstract: 本发明公开了一种基于多模态大模型的家务助理机器人,属于机器人控制、自然语言处理、计算机视觉的交叉领域,包括:静态场景处理模块、动作模块和控制模块;静态场景处理模块用于扫描工作环境,并对工作环境进行3D建模;动作模块用于实现机器人的水平方向的运动,以及对物体的交互动作;控制模块用于控制动作模块的动作,并基于多模态大模型LLaVa‑13B构建监督模型,基于监督模型对动作进行评价,再基于评价结果对动作进行调整。本发明的机器人对家用场景的泛化能力更强,比如家用场景中对特定物体的捡取、擦拭清洁、整理等任务高效的执行,在积累特定任务数据后,扩展机器人的能力,极大的提高用户的生活幸福指数。

    一种基于联合注意力和图学习增强的多模态讽刺检测方法

    公开(公告)号:CN118916683A

    公开(公告)日:2024-11-08

    申请号:CN202411389473.5

    申请日:2024-10-08

    Applicant: 吉林大学

    Abstract: 本发明属于人工智能的多模态讽刺检测技术领域,具体涉及一种基于联合注意力和图学习增强的多模态讽刺检测方法,包括:提取图像文本对的初始图像特征和初始文本特征;对所述初始图像特征和初始文本特征进行联合交叉注意力学习处理,获取联合注意力的图像特征和联合注意力的文本特征;利用图学习对所述联合注意力的文本特征进行增强;将增强后的文本特征和联合注意力的图像特征进行结合,利用结合后的特征预测讽刺倾向。本发明利用联合注意力机制以同时捕捉模态内与模态间的语义不一致性,利用图学习的方式使单模态内捕捉到的内在联系更好地融入到多模态信息当中,以解决多模态讽刺检测任务中的模态间讽刺信息不一致问题。

    一种基于知识蒸馏与变分自编码器的命名实体识别方法

    公开(公告)号:CN118395985B

    公开(公告)日:2024-10-22

    申请号:CN202410866352.9

    申请日:2024-07-01

    Applicant: 吉林大学

    Abstract: 本发明公开了一种基于知识蒸馏与变分自编码器的命名实体识别方法,属于人工智能的自然语言处理技术领域,包括以下步骤:构建有偏数据集对BERT‑large模型进行训练,获得有偏模型,作为教师模型;构建含跨域实体的数据集,结合变分自编码器对BERT‑large模型进行训练,获得学生模型;获取教师模型的输出特征,并从学生模型的变分自编码器的映射空间中解耦出鲁棒性特征和非鲁棒性特征;基于知识蒸馏将非鲁棒性特征与教师模型的输出特征进行拟合,进一步解耦出学生模型中更加鲁棒的特征,基于解耦出的鲁棒性特征进行命名实体识别。本发明实现了对命名实体识别任务中捷径学习的有效缓解,提升了命名实体识别任务的准确性。

    基于信号通道缩放和频域特征补全的人类活动识别方法

    公开(公告)号:CN118070106B

    公开(公告)日:2024-08-23

    申请号:CN202410465732.1

    申请日:2024-04-18

    Applicant: 吉林大学

    Abstract: 本发明提出了基于信号通道缩放和频域特征补全的人类活动识别方法,属于人类活动识别技术领域,包括:对人体活动中的传感器数据进行预处理,获取频域信息和时域信息;对所述频域信息和时域信息进行特征提取,并对提取的特征进行压缩以及特征融合,获取时频融合特征;利用预设分类器对所述时频融合特征进行分类识别,获取人体活动识别结果。本发明有效地校准了多通道信号的特征表示,更好地缓解了人类识别活动中数据的异质性问题,实现人类识别活动的准确识别。

    基于对比相似性损失函数的细粒度图像检索方法

    公开(公告)号:CN110659378B

    公开(公告)日:2023-02-10

    申请号:CN201910844956.2

    申请日:2019-09-07

    Applicant: 吉林大学

    Abstract: 本发明公开了一种基于对比相似性损失函数的细粒度图像检索,所述为了挑选出更有价值的样本对,提出了一种新的样本对采样方法,该样本对采样方法利用类间相似性并通过不对称距离选择更多有效样本对用于训练。同时设计了一种新的加权方案对挑选出的有效样本对分配不同的权重实现对样本对的充分利用,不同样本对的权值是由它们违反正负边界的程度决定的。结合样本对采样和加权过程设计出一个新的对比相似性损失函数用以优化网络,通过该网络为每个类学习一个超球面,利用一个固定边界保持类内分布,并以一定的边距分离不同类别以保证它们的稀疏性。本发明的基于对比相似性损失函数的细粒度图像检索方法具有广泛的应用前景。

    融合特征分布熵的深度图像检索方法

    公开(公告)号:CN110334226B

    公开(公告)日:2022-04-05

    申请号:CN201910340084.6

    申请日:2019-04-25

    Applicant: 吉林大学

    Abstract: 本发明公开了一种融合特征分布熵的深度图像检索方法,所述深度图像检索方法在图像检索中,从图像中提取的特征向量所携带的信息丰富程度会影响图像的检索效果,本发明提出了融合特征分布熵的深度图像检索方法。该算法的核心思想是在R‑MAC特征向量中加入特征分布熵将其作为R‑MAC特征的补充,将特征分布熵与R‑MAC特征通过加权求和的方式融合在一起,得到的特征向量具有区域分布信息和更强的描述能力,从而提升图像检索性能。

    基于CNN和NLSTM神经网络应用于CT影像的颅内出血检测算法

    公开(公告)号:CN111932512A

    公开(公告)日:2020-11-13

    申请号:CN202010785690.1

    申请日:2020-08-06

    Applicant: 吉林大学

    Abstract: 一种基于CNN和NLSTM神经网络应用于CT影像的颅内出血检测算法,属于智能医学影像处理领域。使用CNN神经网络提取CT影像的图片特征。在提取CNN特征之前,CNN神经网络也是经过训练的,我们这里使用的预训练CNN网络为ResNeXt。提取的图像的embedding和病人的序列信息相结合作为NLSTM神经网络的输入,通过交叉熵损失函数计算损失反向传播网络,最后得到的网络结构去进行测试。这种CNN与RNN神经网络相结合的模式很适合处理CT序列影像,CNN与NLSM是一种新颖的颅内出血检测分类方法。本发明基于CNN和NLSTM相结合的颅内出血检测算法,是一种准确高效的自动出血检测和分类算法,对临床有着极其重要的价值,具有广阔的应用场景。

    基于对比相似性损失函数的细粒度图像检索方法

    公开(公告)号:CN110659378A

    公开(公告)日:2020-01-07

    申请号:CN201910844956.2

    申请日:2019-09-07

    Applicant: 吉林大学

    Abstract: 本发明公开了一种基于对比相似性损失函数的细粒度图像检索,所述为了挑选出更有价值的样本对,提出了一种新的样本对采样方法,该样本对采样方法利用类间相似性并通过不对称距离选择更多有效样本对用于训练。同时设计了一种新的加权方案对挑选出的有效样本对分配不同的权重实现对样本对的充分利用,不同样本对的权值是由它们违反正负边界的程度决定的。结合样本对采样和加权过程设计出一个新的对比相似性损失函数用以优化网络,通过该网络为每个类学习一个超球面,利用一个固定边界保持类内分布,并以一定的边距分离不同类别以保证它们的稀疏性。本发明的基于对比相似性损失函数的细粒度图像检索方法具有广泛的应用前景。

Patent Agency Ranking