-
公开(公告)号:CN116011623A
公开(公告)日:2023-04-25
申请号:CN202211610983.1
申请日:2022-12-12
Applicant: 西安交通大学
IPC: G06Q10/04 , G06Q10/0635 , G06Q40/00 , G06F40/126 , G06F40/216 , G06F16/35
Abstract: 一种基于混合比例估计的企业进销项税收风险预测方法,包括:根据进销项发票关联企业,提取企业的文本和非文本信息,对文本信息进行文本嵌入编码,对非文本信息编码,两者合并得到企业特征编码;改进现有的MPE方法,估计税收异常企业的先验概率,得到将税收异常和税收正常企业后验概率转化为标注税收异常和未标注企业后验概率的转移矩阵;构建企业税收风险预测网络并基于转移矩阵将网络的输出映射为标注税收异常企业和未标注企业后验概率,在转移矩阵固定的情况下,基于标注税收异常企业样本和未标注企业样本初始化网络参数;估计得到的转移矩阵,并联合优化学习松弛变量和网络参数,将优化后的网络作为最终的预测模型,实现企业税收风险预测。
-
公开(公告)号:CN114817546A
公开(公告)日:2022-07-29
申请号:CN202210498954.4
申请日:2022-05-09
Applicant: 西安交通大学
IPC: G06F16/35 , G06F40/205 , G06F40/289 , G06K9/62 , G06N3/04 , G06N3/08 , G06Q40/00
Abstract: 本发明公开了一种面向纳税人行业分类的标签噪声学习方法,包括:首先,提取纳税人行业信息中的文本信息和非文本信息,分别基于XLNet文本预训练网络和编码技术进行文本嵌入和非文本编码处理,得到特征信息;其次,构建用于纳税人行业分类的TextCNN网络,根据特征信息和目标分类数来确定网络的层数、卷积核形状以及各层次的输入输出维度,并将XLNet文本预训练网络和TextCNN网络串联,结合带噪的纳税人行业标签数据作为监督,构建端到端的训练装置;再次,并基于改进的混合比例估计方法估计条件转移矩阵;最后,学习训练装置中的网络参数,并将条件转移矩阵作为TextCNN网络之后的线性层,实现噪声标签预测到真实纳税人行业标签预测的转换,进行纳税人行业分类。
-
公开(公告)号:CN114817546B
公开(公告)日:2024-09-10
申请号:CN202210498954.4
申请日:2022-05-09
Applicant: 西安交通大学
IPC: G06F16/35 , G06F40/284 , G06F18/214 , G06F18/2415 , G06N3/045 , G06N3/0464 , G06N3/09 , G06Q40/10
Abstract: 本发明公开了一种面向纳税人行业分类的标签噪声学习方法,包括:首先,提取纳税人行业信息中的文本信息和非文本信息,分别基于XLNet文本预训练网络和编码技术进行文本嵌入和非文本编码处理,得到特征信息;其次,构建用于纳税人行业分类的TextCNN网络,根据特征信息和目标分类数来确定网络的层数、卷积核形状以及各层次的输入输出维度,并将XLNet文本预训练网络和TextCNN网络串联,结合带噪的纳税人行业标签数据作为监督,构建端到端的训练装置;再次,并基于改进的混合比例估计方法估计条件转移矩阵;最后,学习训练装置中的网络参数,并将条件转移矩阵作为TextCNN网络之后的线性层,实现噪声标签预测到真实纳税人行业标签预测的转换,进行纳税人行业分类。
-
公开(公告)号:CN115995019A
公开(公告)日:2023-04-21
申请号:CN202211669312.2
申请日:2022-12-24
Applicant: 西安交通大学
IPC: G06V10/764 , G06V10/74 , G06V10/762 , G06V10/774 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/084 , G06N3/0895
Abstract: 本发明公开了一种基于实例依赖互补标签学习的图像分类方法,包括:在骨干网络之上构建转移矩阵网络和分类器网络,用于估计实例的互补标签转移矩阵和预测实例的真实类别;将实例特征嵌入为指定维度的特征向量,并以特征向量的欧式距离为度量挖掘实例的近邻;结合互补标注分类和语义聚类训练分类器网络,估计实例的真实类后验概率,选取概率前1%大的实例作为近似锚点对转移矩阵网络进行初始化;引入约束——“特征空间上邻近的实例具有更相似的互补标签转移矩阵”——来限制转移矩阵的自由度,并构建端到端的联合训练框架协同优化转移矩阵网络和分类器网络的参数,将优化后的分类器网络作为最终的预测网络,实现基于实例依赖互补标签学习的图像分类。
-
-
-