一种多模态文本分类方法、装置、设备及存储介质

    公开(公告)号:CN117576701A

    公开(公告)日:2024-02-20

    申请号:CN202311541863.5

    申请日:2023-11-17

    Abstract: 本申请公开了一种多模态文本分类方法、装置、设备及存储介质,涉及信息技术领域,包括:基于初始图像、初始输入文本及预定义标签确定目标输入文本,根据目标输入文本及目标语言模型获取目标文本特征;基于初始图像及深度残差网络模型获取初始图像特征,利用注意力机制、初始图像特征及目标文本特征筛选目标图像特征;基于目标语言模型获取中间层无类别文本特征,将中间层无类别文本特征及中间层输入文本特征输入至变分自编码器,得到中间层输入文本特征和中间层无类别文本特征对应的均值和方差;基于均值和方差获取权重值,以便利用分类器根据权重值、目标图像特征及目标文本特征对初始输入文本进行分类。本申请优化了对于图像特征的引入机制。

    一种税法知识库构建方法、装置、设备及介质

    公开(公告)号:CN115600601B

    公开(公告)日:2023-03-31

    申请号:CN202211388864.6

    申请日:2022-11-08

    Abstract: 本申请公开了一种税法知识库构建方法、装置、设备及介质,涉及信息技术领域。该方法包括:获取税法文本并对所述税法文本进行关键段落检测以确定出包含税法知识的目标段落和/或目标句子;根据预设税收标注规范对目标段落和/或目标句子进行批量标注,以确定出针对所述税法文本中的涉税实体;利用所述涉税实体对预设信息抽取模型进行训练并利用训练后得到的目标模型确定出目标数据集;所述目标数据集为基于增量扩展对所述目标段落和/或所述目标句子进行预测后校正得到的数据集;将所述目标数据集与根据所述税法文本预先构建的本体进行信息融合以得到税法知识库。通过本申请的技术方案,可以针对税法优惠领域构建知识库,动态监控标注质量。

    一种税种标签识别方法、装置、电子设备及存储介质

    公开(公告)号:CN114724163A

    公开(公告)日:2022-07-08

    申请号:CN202210380174.X

    申请日:2022-04-12

    Abstract: 本发明提供一种税种标签识别方法、装置、电子设备及存储介质,涉及税务信息处理领域,方法包括:获取税收优惠文档,并对税收优惠文档进行分割,得到条款文本;利用预先训练的第一神经网络模型从条款文本中提取目标文本;目标文本对应的税种标签数量在预设范围之内;利用预先训练的第二神经网络模型在预设税种标签范围中对目标文本进行多标签识别,得到目标文本对应的税种标签;可采用第一神经网络模型用于对条款文本进行预处理,以从这些文本中提取出税种标签数量在预设范围之内的目标文本,以提升多税种标签的识别准确度;同时,还可采用第二神经网络模型对目标文本进行多标签识别得到对应的多个税种标签,进而可满足多税种标签识别的需求。

Patent Agency Ranking