文本分类模型的训练方法、装置、存储介质和电子设备

    公开(公告)号:CN116204632A

    公开(公告)日:2023-06-02

    申请号:CN202211522057.9

    申请日:2022-11-30

    Applicant: 吉林大学

    Abstract: 本申请公开了一种文本分类模型的训练方法、装置、存储介质和电子设备,涉及自然语言学习技术领域。文本分类模型的训练方法包括:获取至少一个标签和至少一个第一未标注文本;根据至少一个所述标签和至少一个所述第一未标注文本,从数据库中获取与每个所述标签对应的目标文本集;根据每个所述标签以及所述标签对应的目标文本集训练所述文本分类模型,直至所述文本分类模型收敛。本申请可以不再依赖标签的质量,且保证文本分类模型的训练效果,乃至训练完成后的文本分类模型的分类效果。

    获取文本语义相似值的方法、装置、存储介质及电子设备

    公开(公告)号:CN112861546A

    公开(公告)日:2021-05-28

    申请号:CN202110210490.8

    申请日:2021-02-25

    Applicant: 吉林大学

    Abstract: 本申请实施例公开了一种获取文本语义相似值的方法,所述方法包括:将至少两个待检测文本及所述至少两个待检测文本之间的相似参数输入到来自变压器的双向编码器表示BERT模型中;基于所述至少两个待检测文本生成查询向量和键值向量对;基于所述查询向量、所述键值向量对和所述相似参数生成点积数据;将所述点积数据经过相似性处理后得到所述至少两个待检测文本之间的相似值。本申请可以在获取至少两个待检测文本之间的相似值时,在不增加训练时长和内存损耗的前提下提高模型效果。

Patent Agency Ranking