一种长尾数据场景下的目标检测方法及装置

    公开(公告)号:CN116958743A

    公开(公告)日:2023-10-27

    申请号:CN202310832461.4

    申请日:2023-07-07

    Applicant: 复旦大学

    Abstract: 本发明属于深度学习中的目标检测技术领域,具体为一种长尾数据场景下的目标检测方法及装置。本发明目标检测方法包括:构建长尾目标检测数据集;在模型训练过程中维护特征缓存模块,为进行目标级别的精确上采样提供数据源基础;利用检测器分类头权重向量的二范数与类别下样本量的正相关关系,设计分布感知的动态上采样策略;利用类别间的相似语义关系,构建多类协同数据增强模块;设计双向调节损失函数,从正负两个方向调节梯度影响;对模型进行整体优化训练,并进行有效性验证。本发明能弥补现有的长尾数据场景下的目标检测方法在处理尾部类别时的不足和技术限制,有效地提高目标检测准确率,尤其是对极具挑战性的尾部类别目标的检测精度。

    一种基于大语言模型的语义日志解析系统

    公开(公告)号:CN118606286A

    公开(公告)日:2024-09-06

    申请号:CN202410559790.0

    申请日:2024-05-08

    Applicant: 复旦大学

    Abstract: 本发明属于自然语言处理技术领域,具体为基于大语言模型的语义日志解析系统。本发明系统包括:子词特征提取模块,通过删除因果掩码使LLAMA2的结构适应解析任务,利用大语言模型的丰富知识为每个子词提取准确的特征表示;语义识别模块,基于多头交叉注意力机制,整合每个子词的特征,进而提取日志模板并预测日志参数的语义类别;解析树模块,以树形结构存储解析得到的模板,与解析过程同步构建和更新,用于加速大规模实时日志的推理过程。本发明在常规解析和语义解析数据集上均取得了满意的效果。本发明有较强的泛化性,能捕获日志的语义特征,并有效缓解了大规模日志数据下解析效率低的问题,能够为日志相关的下游任务提供有力支持。

Patent Agency Ranking