-
公开(公告)号:CN112418652B
公开(公告)日:2024-01-30
申请号:CN202011302019.3
申请日:2020-11-19
Applicant: 税友软件集团股份有限公司
IPC: G06Q10/0635 , G06F18/23 , G06F18/21
Abstract: 本申请公开了一种风险识别方法,包括:根据商品种类和行业标准对获取到的多个组织的商品数据进行数据统计处理,得到所有组织的购销商品矩阵;对所有组织的所述购销商品矩阵进行聚类,得到购销模式聚类结果;从所述购销模式聚类结果将偏离预设比例的组织确定为风险组织。通过对统计出的购销商品矩阵进行聚类,确定对应的购销模式,进而在正常购销模式的基础上确定偏离该购销模式的风险组织,提高了识别风险的准确性。本申请还公开了一种风险识别装置、服务器以及计算机可读存储介质,具有以(56)对比文件邢巍;余锦河;曹肖悦;江帆.基于数据分析的业务风险防控研究.现代商业.2020,(第09期),第15-17页.刘斌;陈凯.基于SMOTE和XGBoost的贷款风险预测方法.计算机与现代化.2020,(第02期),第26-30页.
-
公开(公告)号:CN112418652A
公开(公告)日:2021-02-26
申请号:CN202011302019.3
申请日:2020-11-19
Applicant: 税友软件集团股份有限公司
Abstract: 本申请公开了一种风险识别方法,包括:根据商品种类和行业标准对获取到的多个组织的商品数据进行数据统计处理,得到所有组织的购销商品矩阵;对所有组织的所述购销商品矩阵进行聚类,得到购销模式聚类结果;从所述购销模式聚类结果将偏离预设比例的组织确定为风险组织。通过对统计出的购销商品矩阵进行聚类,确定对应的购销模式,进而在正常购销模式的基础上确定偏离该购销模式的风险组织,提高了识别风险的准确性。本申请还公开了一种风险识别装置、服务器以及计算机可读存储介质,具有以上有益效果。
-
公开(公告)号:CN114331655A
公开(公告)日:2022-04-12
申请号:CN202111676431.6
申请日:2021-12-31
Applicant: 税友软件集团股份有限公司
Abstract: 本申请提供一种基于异构图的税务异常检测方法,包括:获取各公司的税务数据;将所述税务数据输入预设图数据库,并创建所述税务数据对应的不同类型的节点;利用元路径实例级聚合每个节点的多个元路径信息,利用元路径内级聚合不同元路径实例的信息,利用元路径间级从不同元路径实例中学习所述节点的隐含信息;将所述元路径实例级、元路径内级和元路径间级输入至所述异构图,利用交叉熵损失函数计算损失,得到检测模型;利用所述检测模型进行税务异常检测。本申请利用异构图丰富的税务风险信息,可以使偷漏税检测准确率进一步提升。本申请还提供一种基于异构图的税务异常检测系统、计算机可读存储介质和电子设备,具有上述有益效果。
-
公开(公告)号:CN110597995B
公开(公告)日:2022-03-11
申请号:CN201910893763.6
申请日:2019-09-20
Applicant: 税友软件集团股份有限公司
IPC: G06F16/35 , G06F16/31 , G06F40/279
Abstract: 本申请公开了一种商品名称分类方法,包括:利用预设核心词库对目标发票中的目标商品名称进行分类,获得第一商品编码;利用预设商品编码库对目标商品名称进行分类,获得第二商品编码;若目标商品编码符合商品编码格式,则当第二商品编码为多个,且第一商品编码、第二商品编码和目标商品编码中存在相同商品编码时,将相同商品编码添加至目标集合,并叠加目标集合中的每个商品编码对应的权重值,获得叠加权重值;将最大叠加权重值对应的商品编码确定为目标商品名称所属的商品编码。本申请利用核心词库和商品编码库分类发票中的商品名称,可提高分类效率和准确率。本申请公开的一种商品名称分类装置、设备及可读存储介质,也同样具有上述技术效果。
-
公开(公告)号:CN110647590A
公开(公告)日:2020-01-03
申请号:CN201910899829.2
申请日:2019-09-23
Applicant: 税友软件集团股份有限公司
Abstract: 本申请公开了一种目标社群数据的识别方法,包括:将获取到的多个对象的交易关系数据进行交易关系网络构建处理,得到交易关系网络;基于模块度的图聚类算法对所述交易关系网络进行社群分类,得到社群分类结果;根据目标社群的属性确定分析维度,通过所述分析维度对所述社群分类结果进行分析,得到目标社群数据。通过基于模块度的图聚类算法对交易关系网络进行社群分类,得到社群分类结果,再筛选出目标社群数据,提高了目标社群数据查找的精度和准确率,提高了目标社群识别的效果。本申请还公开了一种目标社群数据的识别装置、服务器以及计算机可读存储介质,具有以上有益效果。
-
公开(公告)号:CN109615232A
公开(公告)日:2019-04-12
申请号:CN201811520585.4
申请日:2018-12-12
Applicant: 税友软件集团股份有限公司
Abstract: 本申请所提供的一种信用积分预测的方法,包括:根据预设的各个指标的重要性程度,利用XGBOOST算法从所有企业的指标数据中提取出各个目标指标;在分别获取到各个类别所有企业的目标指标对应的数据集后,利用回归算法对目标类别所有企业对应的数据集进行模型训练,得到回归算法对应的回归模型;将任一目标类别企业的历史数据输入回归模型,得到目标类别企业的信用积分预测结果。可见,该方法利用目标类别所有企业对应的数据集训练出的回归模型,进行目标类别企业的信用积分的预测,能够提高信用积分预测的准确性。本申请还提供一种信用积分预测的系统、设备及计算机可读存储介质,均具有上述有益效果。
-
公开(公告)号:CN117350264B
公开(公告)日:2024-02-23
申请号:CN202311645411.1
申请日:2023-12-04
Applicant: 税友软件集团股份有限公司
IPC: G06F40/186 , G06F40/189
Abstract: 本申请公开了一种PPT文件生成方法、装置、设备及存储介质,涉及税务领域技术领域,包括:获取用户端上传的待分析文件,并通过预设输入检测算法对所述待分析文件的内容进行检测以确定所述待分析文件的内容格式是否符合目标内容模板的内容格式要求;若不符合且所述待分析文件的内容格式为文本内容或对齐图内容时,调用相应的文件处理算法对所述待分析文件的内容进行处理以得到符合所述内容格式要求的待处理文件;利用预设自动PPT生成算法对所述待处理文件中的内容进行解析并匹配对应的目标PPT模板以得到目标PPT文件。这样一来,使用自动PPT生成算法,用户输入文档自动生成PPT,
-
公开(公告)号:CN117350264A
公开(公告)日:2024-01-05
申请号:CN202311645411.1
申请日:2023-12-04
Applicant: 税友软件集团股份有限公司
IPC: G06F40/186 , G06F40/189
Abstract: 本申请公开了一种PPT文件生成方法、装置、设备及存储介质,涉及税务领域技术领域,包括:获取用户端上传的待分析文件,并通过预设输入检测算法对所述待分析文件的内容进行检测以确定所述待分析文件的内容格式是否符合目标内容模板的内容格式要求;若不符合且所述待分析文件的内容格式为文本内容或对齐图内容时,调用相应的文件处理算法对所述待分析文件的内容进行处理以得到符合所述内容格式要求的待处理文件;利用预设自动PPT生成算法对所述待处理文件中的内容进行解析并匹配对应的目标PPT模板以得到目标PPT文件。这样一来,使用自动PPT生成算法,用户输入文档自动生成PPT,提高了效率,降低了人力成本,还确保数据的安全性。
-
公开(公告)号:CN117271567A
公开(公告)日:2023-12-22
申请号:CN202311313291.5
申请日:2023-10-10
Applicant: 税友软件集团股份有限公司
IPC: G06F16/2452 , G06F16/242 , G06N5/022 , G06N3/0455 , G06N3/08
Abstract: 本申请公开了一种基于大模型的税务文本转换方法、装置、设备及存储介质,涉及自然语言处理领域,包括:对获取的财税数据进行预处理,并对得到的预处理后财税数据进行向量化操作;基于向量化财税数据构建财税训练知识库,从财税训练知识库抽取若干向量化财税数据,并将若干向量化财税数据转换为相应的若干标识数据;将若干标识数据作为预设语言模型每层模型层级的输入,以对预设语言模型进行模型微调,得到目标语言模型;接收用户端输入的财税问题,以基于目标语言模型对财税问题进行处理,得到与财税问题匹配的目标数据库语句。这样一来,可以在接收到用户端输入的财税问题时,可以直接基于训练得到的语言模型生成与财税问题对应的数据库语句。
-
公开(公告)号:CN112348604A
公开(公告)日:2021-02-09
申请号:CN202011346801.5
申请日:2020-11-26
Applicant: 税友软件集团股份有限公司
IPC: G06Q30/04 , G06F40/279 , G06F16/38
Abstract: 本申请公开了一种发票商品编码赋值方法、系统、装置及计算机可读存储介质,包括:接收货物名称;利用结巴分词和预设的核心词库对所述货物名称进行分词,得到全模式分词结果和精确模式分词结果;利用复合核心词提取算法、所述全模式分词结果和所述精确模式分词结果在所述核心词库中匹配,得到多个匹配结果;利用预先设定的加权占比和所述核心词库中记载的每个匹配结果中的货物商品编码开具公司数量占比,计算出每个匹配结果的置信度;输出置信度最高的匹配结果。本申请利用多种复合算法提取核心词,进行匹配提高了匹配的命中率,得到多种匹配结果,最后利用置信度从中挑选出置信度最高的匹配结果,确保了最终结果的精准度。
-
-
-
-
-
-
-
-
-