-
公开(公告)号:CN114077872B
公开(公告)日:2024-09-27
申请号:CN202111435970.0
申请日:2021-11-29
Applicant: 税友软件集团股份有限公司
IPC: G06F18/2433 , G06F18/232 , G06F18/25 , G06N3/0455 , G06N3/0464 , G06N3/084 , G06N3/088 , G06Q40/04 , G06Q40/10
Abstract: 本申请公开了一种数据异常检测方法,包括:基于数据格式对原始数据进行预处理,得到多个数据矩阵;采用卷积降噪自动编码器模型对所述多个数据矩阵进行表示向量提取,得到每个数据矩阵对应的表示向量;将所有所述表示向量进行多输入融合,得到目标表示向量;基于密度DBSCAN算法对所述目标表示向量进行聚类分析,得到异常点;将所述异常点的数据标记为异常数据。实现在缺少标签数据的背景下,借助无监督的聚类算法检测出异常数据,提高数据检测的准确性。本申请还公开了一种数据异常检测装置、服务器以及计算机可读存储介质,具有以上有益效果,在此不做赘述。
-
公开(公告)号:CN114997973A
公开(公告)日:2022-09-02
申请号:CN202210319423.4
申请日:2022-03-29
Applicant: 税友软件集团股份有限公司
IPC: G06Q40/00 , G06F16/951 , G06F16/338
Abstract: 本发明提供一种税收优惠信息查询方法、装置、电子设备及存储介质,涉及税务信息处理领域,方法包括:获取税收优惠文档,并从税收优惠文档中提取纳税主体及其他特征信息;将纳税主体与其他特征信息建立关联关系,并根据关联关系将纳税主体及其他特征信息转换为以纳税主体为中心的径向图;当接收到用户输入的目标纳税主体时,输出目标纳税主体对应的目标径向图,以利用目标径向图提供税收优惠信息查询服务;可从税收优惠文档中提取税收主体及其他特征信息并转换为可视化的径向图,以便用户利用该图查询税收优惠信息,能够有效应对税收优惠文档规模大、知识碎片化、组织结构松散等问题,进而可有效提升用户了解税收优惠政策的便捷程度。
-
公开(公告)号:CN114331655A
公开(公告)日:2022-04-12
申请号:CN202111676431.6
申请日:2021-12-31
Applicant: 税友软件集团股份有限公司
Abstract: 本申请提供一种基于异构图的税务异常检测方法,包括:获取各公司的税务数据;将所述税务数据输入预设图数据库,并创建所述税务数据对应的不同类型的节点;利用元路径实例级聚合每个节点的多个元路径信息,利用元路径内级聚合不同元路径实例的信息,利用元路径间级从不同元路径实例中学习所述节点的隐含信息;将所述元路径实例级、元路径内级和元路径间级输入至所述异构图,利用交叉熵损失函数计算损失,得到检测模型;利用所述检测模型进行税务异常检测。本申请利用异构图丰富的税务风险信息,可以使偷漏税检测准确率进一步提升。本申请还提供一种基于异构图的税务异常检测系统、计算机可读存储介质和电子设备,具有上述有益效果。
-
公开(公告)号:CN117708326A
公开(公告)日:2024-03-15
申请号:CN202311697780.5
申请日:2023-12-12
Applicant: 税友软件集团股份有限公司
IPC: G06F16/35 , G06F40/30 , G06F18/214 , G06F18/241 , G06Q40/10
Abstract: 本申请公开了一种财税数据关系抽取方法、装置、设备及存储介质,涉及信息处理技术领域,包括:获取待训练文本集中的当前文本样例;所述待训练文本集为与财税数据相关的文本集;基于头尾实体的类型从所述待训练文本集中确定出与所述当前文本样例对应的正样例和负样例;利用预设文本编码器分别对所述当前文本样例、所述正样例和所述负样例进行编码,以得到第一向量、第二向量和第三向量;根据所述第一向量,并利用所述第二向量和所述第三向量对初始分类器进行训练,以得到目标分类器,以便利用所述目标分类器对相关财税数据进行关系抽取操作。这样一来,本申请考虑文本头尾实体的类型,再进一步训练分类器,可以提高对相近语义关系的区分能力。
-
公开(公告)号:CN116503186A
公开(公告)日:2023-07-28
申请号:CN202310162407.3
申请日:2023-02-16
Applicant: 税友软件集团股份有限公司
IPC: G06Q40/12 , G06F40/295 , G06F40/30 , G06N3/09
Abstract: 本申请涉及深度学习领域,公开了一种税务文本处理方法、装置、介质,包括:获取待处理文本,以便于后续提取待处理文本中的实体和实体关系;调用税务文本处理模型对待处理文本进行处理,以输出实体信息;其中,税务文本处理模型为结合基于语义理解的深度双向预训练模型和基于span的实体抽取模型获得的模型,基于语义理解的深度双向预训练模型能够利用无标注数据集进行自监督训练,减少对标注数据的依赖性,基于span的实体抽取策略能够使模型更好的识别嵌套实体,从而获取实体信息。并通过关系分类模型处理实体信息,以获取待处理文本中的实体关系。本方案能够快速准确的提取税务文本中的实体信息和实体关系信息,减少人力物力的浪费。
-
公开(公告)号:CN114722151A
公开(公告)日:2022-07-08
申请号:CN202210373116.4
申请日:2022-04-11
Applicant: 税友软件集团股份有限公司
IPC: G06F16/33 , G06F16/35 , G06F40/211 , G06F40/30 , G06N3/08
Abstract: 本发明提供一种税收优惠文档特征提取方法、装置、电子设备及存储介质,涉及税务信息处理领域,方法包括:获取税收优惠文档,并对税收优惠文档进行分割,得到初始条款文本;利用第一神经网络模型提取初始条款文本中的税收优惠条款文本;利用预设的特征提取正则表达式和/或第二神经网络模型提取税收优惠条款文本中不同预设特征类型的特征信息;根据预设特征类型将特征信息保存至数据库;可采用正则表达式和神经网络模型提取税收优惠文档中的特征信息,其中正则表达式可提取结构特征较为明显的特征信息,神经网络模型可提取结构较为离散且无明显规律的特征信息,进而有效提升对税收优惠文档中特征信息的提取效率,便于税务领域可用数据集的生成。
-
公开(公告)号:CN114529384A
公开(公告)日:2022-05-24
申请号:CN202210147705.0
申请日:2022-02-17
Applicant: 税友软件集团股份有限公司
Abstract: 本申请公开了一种投产数据异常检测方法,包括:基于异常单位特征信息对获取到的原始投产数据进行预处理,得到待检测投产数据;基于训练数据对构建的投产数据关系映射模型进行训练,得到浅层神经网络模型;基于所述浅层神经网络模型对所述待检测投产数据进行检测,得到异常投产数据。通过先对原始投产数据进行预处理,以便剔除原始数据中存在异常的数据,然后训练得到浅层神经网络模型,最后进行检测得到异常投产数据,实现确定出正常投产数据和异常投产数据之间的差距,而不是采用历史数据进行判断,提高异常数据检测的准确性。本申请还公开了一种投产数据异常检测装置、服务器以及计算机可读存储介质,具有以上有益效果。
-
公开(公告)号:CN115600601A
公开(公告)日:2023-01-13
申请号:CN202211388864.6
申请日:2022-11-08
Applicant: 税友软件集团股份有限公司(CN)
IPC: G06F40/295 , G06F16/335 , G06Q40/12 , G06Q50/18
Abstract: 本申请公开了一种税法知识库构建方法、装置、设备及介质,涉及信息技术领域。该方法包括:获取税法文本并对所述税法文本进行关键段落检测以确定出包含税法知识的目标段落和/或目标句子;根据预设税收标注规范对目标段落和/或目标句子进行批量标注,以确定出针对所述税法文本中的涉税实体;利用所述涉税实体对预设信息抽取模型进行训练并利用训练后得到的目标模型确定出目标数据集;所述目标数据集为基于增量扩展对所述目标段落和/或所述目标句子进行预测后校正得到的数据集;将所述目标数据集与根据所述税法文本预先构建的本体进行信息融合以得到税法知识库。通过本申请的技术方案,可以针对税法优惠领域构建知识库,动态监控标注质量。
-
公开(公告)号:CN114077872A
公开(公告)日:2022-02-22
申请号:CN202111435970.0
申请日:2021-11-29
Applicant: 税友软件集团股份有限公司
Abstract: 本申请公开了一种数据异常检测方法,包括:基于数据格式对原始数据进行预处理,得到多个数据矩阵;采用卷积降噪自动编码器模型对所述多个数据矩阵进行表示向量提取,得到每个数据矩阵对应的表示向量;将所有所述表示向量进行多输入融合,得到目标表示向量;基于密度DBSCAN算法对所述目标表示向量进行聚类分析,得到异常点;将所述异常点的数据标记为异常数据。实现在缺少标签数据的背景下,借助无监督的聚类算法检测出异常数据,提高数据检测的准确性。本申请还公开了一种数据异常检测装置、服务器以及计算机可读存储介质,具有以上有益效果,在此不做赘述。
-
公开(公告)号:CN117710125A
公开(公告)日:2024-03-15
申请号:CN202311713465.7
申请日:2023-12-13
Applicant: 税友软件集团股份有限公司
IPC: G06Q40/10 , G06F18/214 , G06F18/2433 , G06F18/213
Abstract: 本申请公开了一种税务异常检测方法、装置、设备及介质,涉及数据挖掘和税务稽查领域,包括:构建初始纳税人特征矩阵和初始交易关系邻接矩阵;构建以纳税人为第一节点集合和以社团为第二节点集合的二部图的初始二部图邻接矩阵以及纳税人的待训练纳税人特征和社团的待训练社团特征;根据图结构学习方法基于上述构建的矩阵和特征训练深度学习模型,得到目标社团特征矩阵和目标二部图邻接矩阵;将目标社团特征矩阵中目标社团特征输入局部异常因子异常检测模型得到每个社团的异常分数,基于目标二部图邻接矩阵确定异常分数大于预设分数的异常社团对应的异常纳税人。能够通过深度学习进行纳税人异常社团检测以及进行重叠社团检测。
-
-
-
-
-
-
-
-
-