一种税法知识库构建方法、装置、设备及介质

    公开(公告)号:CN115600601A

    公开(公告)日:2023-01-13

    申请号:CN202211388864.6

    申请日:2022-11-08

    Abstract: 本申请公开了一种税法知识库构建方法、装置、设备及介质,涉及信息技术领域。该方法包括:获取税法文本并对所述税法文本进行关键段落检测以确定出包含税法知识的目标段落和/或目标句子;根据预设税收标注规范对目标段落和/或目标句子进行批量标注,以确定出针对所述税法文本中的涉税实体;利用所述涉税实体对预设信息抽取模型进行训练并利用训练后得到的目标模型确定出目标数据集;所述目标数据集为基于增量扩展对所述目标段落和/或所述目标句子进行预测后校正得到的数据集;将所述目标数据集与根据所述税法文本预先构建的本体进行信息融合以得到税法知识库。通过本申请的技术方案,可以针对税法优惠领域构建知识库,动态监控标注质量。

    一种税务文本处理方法、装置、介质

    公开(公告)号:CN116503186A

    公开(公告)日:2023-07-28

    申请号:CN202310162407.3

    申请日:2023-02-16

    Abstract: 本申请涉及深度学习领域,公开了一种税务文本处理方法、装置、介质,包括:获取待处理文本,以便于后续提取待处理文本中的实体和实体关系;调用税务文本处理模型对待处理文本进行处理,以输出实体信息;其中,税务文本处理模型为结合基于语义理解的深度双向预训练模型和基于span的实体抽取模型获得的模型,基于语义理解的深度双向预训练模型能够利用无标注数据集进行自监督训练,减少对标注数据的依赖性,基于span的实体抽取策略能够使模型更好的识别嵌套实体,从而获取实体信息。并通过关系分类模型处理实体信息,以获取待处理文本中的实体关系。本方案能够快速准确的提取税务文本中的实体信息和实体关系信息,减少人力物力的浪费。

    一种投产数据异常检测方法及相关装置

    公开(公告)号:CN114529384A

    公开(公告)日:2022-05-24

    申请号:CN202210147705.0

    申请日:2022-02-17

    Abstract: 本申请公开了一种投产数据异常检测方法,包括:基于异常单位特征信息对获取到的原始投产数据进行预处理,得到待检测投产数据;基于训练数据对构建的投产数据关系映射模型进行训练,得到浅层神经网络模型;基于所述浅层神经网络模型对所述待检测投产数据进行检测,得到异常投产数据。通过先对原始投产数据进行预处理,以便剔除原始数据中存在异常的数据,然后训练得到浅层神经网络模型,最后进行检测得到异常投产数据,实现确定出正常投产数据和异常投产数据之间的差距,而不是采用历史数据进行判断,提高异常数据检测的准确性。本申请还公开了一种投产数据异常检测装置、服务器以及计算机可读存储介质,具有以上有益效果。

    一种税法知识库构建方法、装置、设备及介质

    公开(公告)号:CN115600601B

    公开(公告)日:2023-03-31

    申请号:CN202211388864.6

    申请日:2022-11-08

    Abstract: 本申请公开了一种税法知识库构建方法、装置、设备及介质,涉及信息技术领域。该方法包括:获取税法文本并对所述税法文本进行关键段落检测以确定出包含税法知识的目标段落和/或目标句子;根据预设税收标注规范对目标段落和/或目标句子进行批量标注,以确定出针对所述税法文本中的涉税实体;利用所述涉税实体对预设信息抽取模型进行训练并利用训练后得到的目标模型确定出目标数据集;所述目标数据集为基于增量扩展对所述目标段落和/或所述目标句子进行预测后校正得到的数据集;将所述目标数据集与根据所述税法文本预先构建的本体进行信息融合以得到税法知识库。通过本申请的技术方案,可以针对税法优惠领域构建知识库,动态监控标注质量。

Patent Agency Ranking