一种多标签文本分类方法、装置和设备

    公开(公告)号:CN119829769A

    公开(公告)日:2025-04-15

    申请号:CN202411912631.0

    申请日:2024-12-24

    Abstract: 本发明提供一种多标签文本分类方法、装置和设备,涉及深度学习技术领域,包括:获取多个文本样本以及所述文本样本对应的标签序列,利用文本样本和标签序列对初始预测模型进行训练,通过二元交叉熵损失函数确定初始预测模型的主要损失函数值;通过计算正点互PPMI关联性矩阵和每个标签序列之间相关性差异,确定初始预测模型的第一辅助损失函数值;基于文本标签相似度矩阵和边界排名损失函数确定初始预测模型的第二辅助损失函数值;基于上述损失函数值调整初始预测模型的内部参数,得到多标签文本分类模型。本发明通过捕获标签间的语义相关性,并与文本特征训练得到的结果进行比较以优化模型预测结果,有效提升了多标签分类的整体准确性。

    一种中文命名实体识别方法、设备及存储介质

    公开(公告)号:CN117436450A

    公开(公告)日:2024-01-23

    申请号:CN202311500644.2

    申请日:2023-11-08

    Abstract: 本发明提供了一种中文命名实体识别方法、设备及存储介质,其方法包括:获取原始文本以及标签数据,原始文本包含字序列、对原始文本分词处理,获得词序列、将字、词序列输入数据嵌入层获得字、词嵌入向量、将字、词嵌入向量输入特征提取层获取字、词特征、输入字、词特征至特征融合层得到融合字词特征、输入融合字词特征至线性层获取每个字符对应于不同标签的分数,将结果传入CRF中得到最优序列标注;设备及存储介质用于实现方法;本发明的有益效果是:提高语义的表示能力并获得有效的词汇信息以提升实体识别的准确率,能使用更少的参数捕获更多的信息和提高模型性能。

    一种生态城市遥感监测野外核查方法及设备

    公开(公告)号:CN117592697A

    公开(公告)日:2024-02-23

    申请号:CN202311493684.9

    申请日:2023-11-09

    Abstract: 本申请提供了一种生态城市遥感监测野外核查方法,包括:获取核查图斑的地理位置,创建核查任务;根据地理位置,将核查任务分配给各个用户进行图斑的核查任务,用户获取对应的核查任务;核查任务以文字、视频、语音以及图片的方式展示,显示核查任务在地图的任务区域,用户在小程序端交互到地图的任务区域时,触发任务区域的后续的核查任务,用户进行图斑的核查任务并上传核查数据至系统,判断核查数据与核查任务是否存在异常情况;根据预设标准,对验证后核查数据进行审核,确定核查数据中的有效数据以及无效数据,将无效数据反馈至用户;通过有效数据,校验并更新对应核查图斑的历史的有效数据,完成对国家园林城市遥感监测野外的核查工作。

    胁迫植被指示性信息提取方法、装置、设备及存储介质

    公开(公告)号:CN116797833A

    公开(公告)日:2023-09-22

    申请号:CN202310747893.5

    申请日:2023-06-21

    Abstract: 本发明提供了一种胁迫植被指示性信息提取方法,包括:搭建基于ViT框架的胁迫植被指示性信息提取模型;制作源域和目标域样本;将源域样本划分为训练集和验证集,作为模型的输入;对输入数据进行预处理操作;通过FOPE模块对预处理后的数据进行处理,获得分片数据,并将特征图进行零值填充;将分片数据经过Transformer编码器后,获得源域编码数据;将目标域样本作为模型的输入数据,重复上述预处理、分片及零值填充、编码步骤,获得目标域编码数据;通过自适应层计算源域和目标域的差值,调整模型,当差值小于设定阈值时,训练结束,通过Transformer解码器输出目标域识别结果。本发明能实现对未知高植被覆盖区快速大范围的寻找胁迫植被,且能实现较高的识别精度。

Patent Agency Ranking