-
公开(公告)号:CN117076631A
公开(公告)日:2023-11-17
申请号:CN202311024423.2
申请日:2023-08-15
Applicant: 税友软件集团股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/335 , G06F40/279 , G06F18/214 , G06Q40/12
Abstract: 本申请公开了一种基于LLaMA的财税问答模型构建方法、装置、设备及介质,涉及模型训练领域,包括:通过低阶自适应技术利用预设中文训练集对预设LLaMA‑7B模型进行微调,以得到通用中文语言大模型;获取预设财税数据,并基于预设过滤规则对所述财税数据进行数据过滤,以得到过滤后财税数据;对过滤后财税数据进行分词处理,以将所述过滤后财税数据切分为若干分词结果序列,并基于所述分词结果序列创建中文财税训练集;基于所述中文财税训练集对所述通用中文语言大模型进行训练,以得到基于LLaMA的目标财税问答模型。这样一来,可以基于收集的财税语料在垂直领域对模型进行训练,减小模型训练难度,得到应用于财税行业专项领域的问答模型。
-
公开(公告)号:CN115600601A
公开(公告)日:2023-01-13
申请号:CN202211388864.6
申请日:2022-11-08
Applicant: 税友软件集团股份有限公司(CN)
IPC: G06F40/295 , G06F16/335 , G06Q40/12 , G06Q50/18
Abstract: 本申请公开了一种税法知识库构建方法、装置、设备及介质,涉及信息技术领域。该方法包括:获取税法文本并对所述税法文本进行关键段落检测以确定出包含税法知识的目标段落和/或目标句子;根据预设税收标注规范对目标段落和/或目标句子进行批量标注,以确定出针对所述税法文本中的涉税实体;利用所述涉税实体对预设信息抽取模型进行训练并利用训练后得到的目标模型确定出目标数据集;所述目标数据集为基于增量扩展对所述目标段落和/或所述目标句子进行预测后校正得到的数据集;将所述目标数据集与根据所述税法文本预先构建的本体进行信息融合以得到税法知识库。通过本申请的技术方案,可以针对税法优惠领域构建知识库,动态监控标注质量。
-
公开(公告)号:CN114996319B
公开(公告)日:2022-11-04
申请号:CN202210913579.5
申请日:2022-08-01
Applicant: 税友软件集团股份有限公司
IPC: G06F16/2455 , G06F16/2457
Abstract: 本申请公开了一种基于规则引擎的数据处理方法、装置、设备及存储介质,涉及计算机软件开发技术领域。该方法包括:获取不同的数据源以统一的数据装填格式进行装填后确定出的元数据和预设业务规则;其中,所述元数据为用于记录与所述预设业务规则相关的本体以及利用所述元数据中的目标本体进行聚合确定出相应的衍生指标的元数据;所述目标本体为根据用户需求从所述元数据中选择的本体;通过预设数据获取方式获取与所述元数据对应的相关数据,并将所述相关数据装载为对应的实体;根据所述预设业务规则对所述实体进行批量的规则运算,以返回相应的处理结果。通过本申请的技术方案,可以提升规则运算效率,提高规则引擎的适用范围。
-
公开(公告)号:CN104112074B
公开(公告)日:2016-01-13
申请号:CN201410336118.1
申请日:2014-07-15
Applicant: 西安交通大学 , 税友软件集团股份有限公司
IPC: G06Q40/00
Abstract: 本发明提出了一种基于直觉模糊集的纳税人利益关联度评估方法,根据纳税人之间的各类税务数据,包括发票、商品交易、所有权占比等,评估纳税人之间的利益关联程度。该方法将纳税人之间的各类税务数据作为量测数据,根据量测数据自身分布规律进行等级划分;计算各量测数据所属的等级,以及对应的隶属度值和非隶属度值,构造量测数据的直觉模糊集;采用基于Einstein操作的直觉模糊集融合方法对量测数据进行融合计算,得到纳税人利益关联度的直觉模糊集,评估纳税人之间的利益关联程度。本发明能够很好地处理多样的和异构的税务数据,将多样异构的税务数据归一化后进行融合,且不要求多个税务指标数据之间相互独立,具有广阔的适用范围。
-
公开(公告)号:CN117332791B
公开(公告)日:2024-03-01
申请号:CN202311624845.3
申请日:2023-11-30
Applicant: 税友软件集团股份有限公司
IPC: G06F40/35 , G06F16/332 , G06F16/33 , G06F18/214 , G06N3/04 , G06N3/08
Abstract: 本申请公开了一种大语言模型训练方法、装置、设备及存储介质,涉及大语言模型领域,包括:获取初始语料数据并进行数据清洗得到目标语料数据,以创建第一训练数据集;将P‑Tuning v2模块嵌入预训练语言大模型的适配器模块,并基于第一训练数据集对适配器模块进行训练;基于第一训练数据集构建第二训练数据集,并在底座大模型中嵌入预设门控模块;基于第二训练数据集对预设门控模块进行训练,在预训练语言大模型收敛后停止训练。通过将P‑Tuning v2模块嵌入预训练语言大模型的适配器模块,和基于前置的门控模块改造预训练的底座模型,将训练流
-
公开(公告)号:CN114997973A
公开(公告)日:2022-09-02
申请号:CN202210319423.4
申请日:2022-03-29
Applicant: 税友软件集团股份有限公司
IPC: G06Q40/00 , G06F16/951 , G06F16/338
Abstract: 本发明提供一种税收优惠信息查询方法、装置、电子设备及存储介质,涉及税务信息处理领域,方法包括:获取税收优惠文档,并从税收优惠文档中提取纳税主体及其他特征信息;将纳税主体与其他特征信息建立关联关系,并根据关联关系将纳税主体及其他特征信息转换为以纳税主体为中心的径向图;当接收到用户输入的目标纳税主体时,输出目标纳税主体对应的目标径向图,以利用目标径向图提供税收优惠信息查询服务;可从税收优惠文档中提取税收主体及其他特征信息并转换为可视化的径向图,以便用户利用该图查询税收优惠信息,能够有效应对税收优惠文档规模大、知识碎片化、组织结构松散等问题,进而可有效提升用户了解税收优惠政策的便捷程度。
-
公开(公告)号:CN114996319A
公开(公告)日:2022-09-02
申请号:CN202210913579.5
申请日:2022-08-01
Applicant: 税友软件集团股份有限公司
IPC: G06F16/2455 , G06F16/2457
Abstract: 本申请公开了一种基于规则引擎的数据处理方法、装置、设备及存储介质,涉及计算机软件开发技术领域。该方法包括:获取不同的数据源以统一的数据装填格式进行装填后确定出的元数据和预设业务规则;其中,所述元数据为用于记录与所述预设业务规则相关的本体以及利用所述元数据中的目标本体进行聚合确定出相应的衍生指标的元数据;所述目标本体为根据用户需求从所述元数据中选择的本体;通过预设数据获取方式获取与所述元数据对应的相关数据,并将所述相关数据装载为对应的实体;根据所述预设业务规则对所述实体进行批量的规则运算,以返回相应的处理结果。通过本申请的技术方案,可以提升规则运算效率,提高规则引擎的适用范围。
-
公开(公告)号:CN112330379A
公开(公告)日:2021-02-05
申请号:CN202011337634.8
申请日:2020-11-25
Applicant: 税友软件集团股份有限公司
Abstract: 本申请公开了一种发票内容生成方法,所述方法包括:利用AC自动机对目标文本进行多模式自动匹配得到商品名称;查询所述商品名称的分类概率信息,并根据所述分类概率信息生成第一分类特征向量;将所述目标文本输入BERT模型得到第二分类特征向量;对所述第一分类特征向量和所述第二分类特征向量进行拼接得到拼接向量,将所述拼接向量输入卷积神经网络模型,得到所述目标文本的分类结果;在发票的货物名称填写区域生成所述分类结果对应的文本内容。本申请能够提高确定发票货物名称的准确率,保证发票内容的正确性。本申请还公开了一种发票内容生成系统、一种电子设备及一种存储介质,具有以上有益效果。
-
公开(公告)号:CN109711732A
公开(公告)日:2019-05-03
申请号:CN201811615499.1
申请日:2018-12-27
Applicant: 税友软件集团股份有限公司
Abstract: 本申请公开了一种指标积分的存储方法,通过获取目标对象的满足预设条件的指标积分项目;然后按照预设规则计算出与指标积分项目对应的指标积分;再将指标积分添加至目标存储位置。由于计算出的指标积分是通过添加的方式存储至目标存储位置的,因此目标存储位置能够保存有不同时间点计算出的指标积分,从而在后续操作中可以查询并使用历史计算出的指标积分,从而提高用户的使用体验。本申请还公开了一种指标积分的存储装置、设备及计算机可读存储介质,均具有上述有益效果。
-
公开(公告)号:CN109635007A
公开(公告)日:2019-04-16
申请号:CN201811550706.X
申请日:2018-12-18
Applicant: 税友软件集团股份有限公司
IPC: G06F16/2458
Abstract: 本申请公开了一种行为评估方法,包括对已知行为类型的目标企业的目标数据信息进行信息抽取,获得初始关联企业信息和初始关联人员信息;对初始关联企业进行传染度计算,对初始关联人员进行亲密度计算,从而获得中间关联企业信息和中间关联人员信息;根据中间关联企业信息和中间关联人员信息构建关联网络大图,并对其进行关联程度筛选,获得关联企业和关联人员,将关联企业和关联人员标记为目标企业对应的行为类型;该方法可根据特定行为类型的企业的相关信息快速且精确地挖掘出整个关联团体,从而实现整个企业团体的有效评估和统一管理。本申请还公开了一种行为评估装置、设备及计算机可读存储介质,均具有上述有益效果。
-
-
-
-
-
-
-
-
-