-
公开(公告)号:CN112348604A
公开(公告)日:2021-02-09
申请号:CN202011346801.5
申请日:2020-11-26
Applicant: 税友软件集团股份有限公司
IPC: G06Q30/04 , G06F40/279 , G06F16/38
Abstract: 本申请公开了一种发票商品编码赋值方法、系统、装置及计算机可读存储介质,包括:接收货物名称;利用结巴分词和预设的核心词库对所述货物名称进行分词,得到全模式分词结果和精确模式分词结果;利用复合核心词提取算法、所述全模式分词结果和所述精确模式分词结果在所述核心词库中匹配,得到多个匹配结果;利用预先设定的加权占比和所述核心词库中记载的每个匹配结果中的货物商品编码开具公司数量占比,计算出每个匹配结果的置信度;输出置信度最高的匹配结果。本申请利用多种复合算法提取核心词,进行匹配提高了匹配的命中率,得到多种匹配结果,最后利用置信度从中挑选出置信度最高的匹配结果,确保了最终结果的精准度。
-
公开(公告)号:CN110597995A
公开(公告)日:2019-12-20
申请号:CN201910893763.6
申请日:2019-09-20
Applicant: 税友软件集团股份有限公司
Abstract: 本申请公开了一种商品名称分类方法,包括:利用预设核心词库对目标发票中的目标商品名称进行分类,获得第一商品编码;利用预设商品编码库对目标商品名称进行分类,获得第二商品编码;若目标商品编码符合商品编码格式,则当第二商品编码为多个,且第一商品编码、第二商品编码和目标商品编码中存在相同商品编码时,将相同商品编码添加至目标集合,并叠加目标集合中的每个商品编码对应的权重值,获得叠加权重值;将最大叠加权重值对应的商品编码确定为目标商品名称所属的商品编码。本申请利用核心词库和商品编码库分类发票中的商品名称,可提高分类效率和准确率。本申请公开的一种商品名称分类装置、设备及可读存储介质,也同样具有上述技术效果。
-
公开(公告)号:CN114077872B
公开(公告)日:2024-09-27
申请号:CN202111435970.0
申请日:2021-11-29
Applicant: 税友软件集团股份有限公司
IPC: G06F18/2433 , G06F18/232 , G06F18/25 , G06N3/0455 , G06N3/0464 , G06N3/084 , G06N3/088 , G06Q40/04 , G06Q40/10
Abstract: 本申请公开了一种数据异常检测方法,包括:基于数据格式对原始数据进行预处理,得到多个数据矩阵;采用卷积降噪自动编码器模型对所述多个数据矩阵进行表示向量提取,得到每个数据矩阵对应的表示向量;将所有所述表示向量进行多输入融合,得到目标表示向量;基于密度DBSCAN算法对所述目标表示向量进行聚类分析,得到异常点;将所述异常点的数据标记为异常数据。实现在缺少标签数据的背景下,借助无监督的聚类算法检测出异常数据,提高数据检测的准确性。本申请还公开了一种数据异常检测装置、服务器以及计算机可读存储介质,具有以上有益效果,在此不做赘述。
-
公开(公告)号:CN110597995B
公开(公告)日:2022-03-11
申请号:CN201910893763.6
申请日:2019-09-20
Applicant: 税友软件集团股份有限公司
IPC: G06F16/35 , G06F16/31 , G06F40/279
Abstract: 本申请公开了一种商品名称分类方法,包括:利用预设核心词库对目标发票中的目标商品名称进行分类,获得第一商品编码;利用预设商品编码库对目标商品名称进行分类,获得第二商品编码;若目标商品编码符合商品编码格式,则当第二商品编码为多个,且第一商品编码、第二商品编码和目标商品编码中存在相同商品编码时,将相同商品编码添加至目标集合,并叠加目标集合中的每个商品编码对应的权重值,获得叠加权重值;将最大叠加权重值对应的商品编码确定为目标商品名称所属的商品编码。本申请利用核心词库和商品编码库分类发票中的商品名称,可提高分类效率和准确率。本申请公开的一种商品名称分类装置、设备及可读存储介质,也同样具有上述技术效果。
-
公开(公告)号:CN112330379A
公开(公告)日:2021-02-05
申请号:CN202011337634.8
申请日:2020-11-25
Applicant: 税友软件集团股份有限公司
Abstract: 本申请公开了一种发票内容生成方法,所述方法包括:利用AC自动机对目标文本进行多模式自动匹配得到商品名称;查询所述商品名称的分类概率信息,并根据所述分类概率信息生成第一分类特征向量;将所述目标文本输入BERT模型得到第二分类特征向量;对所述第一分类特征向量和所述第二分类特征向量进行拼接得到拼接向量,将所述拼接向量输入卷积神经网络模型,得到所述目标文本的分类结果;在发票的货物名称填写区域生成所述分类结果对应的文本内容。本申请能够提高确定发票货物名称的准确率,保证发票内容的正确性。本申请还公开了一种发票内容生成系统、一种电子设备及一种存储介质,具有以上有益效果。
-
公开(公告)号:CN114077872A
公开(公告)日:2022-02-22
申请号:CN202111435970.0
申请日:2021-11-29
Applicant: 税友软件集团股份有限公司
Abstract: 本申请公开了一种数据异常检测方法,包括:基于数据格式对原始数据进行预处理,得到多个数据矩阵;采用卷积降噪自动编码器模型对所述多个数据矩阵进行表示向量提取,得到每个数据矩阵对应的表示向量;将所有所述表示向量进行多输入融合,得到目标表示向量;基于密度DBSCAN算法对所述目标表示向量进行聚类分析,得到异常点;将所述异常点的数据标记为异常数据。实现在缺少标签数据的背景下,借助无监督的聚类算法检测出异常数据,提高数据检测的准确性。本申请还公开了一种数据异常检测装置、服务器以及计算机可读存储介质,具有以上有益效果,在此不做赘述。
-
公开(公告)号:CN109543668B
公开(公告)日:2021-05-25
申请号:CN201811444735.8
申请日:2018-11-29
Applicant: 税友软件集团股份有限公司
Abstract: 本发明公开了一种工资条项目识别方法,该方法包括以下步骤:获取目标工资条的项目序列,并对项目序列进行清洗,获得目标项目序列;利用完全匹配字典、模糊匹配字典和TF‑IDF分别对目标项目序列中的各个字段分别进行加权,获得完全加权矩阵、模糊加权矩阵和TF‑IDF加权矩阵;对完全加权矩阵、模糊加权矩阵和TF‑IDF加权矩阵进行矩阵拼接,获得综合加权矩阵;将综合加权矩阵中各个字段的向量输入至分类器中进行识别,获得识别结果。可提高工资条项目识别的准确率。本发明还公开了一种工资条项目识别装置、设备及可读存储介质,具有相应的技术效果。
-
公开(公告)号:CN111190973A
公开(公告)日:2020-05-22
申请号:CN201911420087.7
申请日:2019-12-31
Applicant: 税友软件集团股份有限公司
Abstract: 本申请公开了一种申报表的分类方法,包括:预先利用深度学习神经网络训练出分类模型;获取目标申报表的各目标项目名称;将各目标项目名称输入至预设的分类模型中,并得出对应的分类结果。由于分类模型预先学习了各不同类型的财务报表的特征,因此相较于现有技术中通过将目标申报表与标准财务报表进行项目名称匹配以确定目标申报表的报表类型的方式,本方法能够排除掉无关符号、乱码以及表述上的差异等情况对分类的影响,进而提高对申报表进行分类的准确度。本申请还公开了一种申报表的分类装置、设备及计算机可读存储介质,均具有上述有益效果。
-
公开(公告)号:CN112348604B
公开(公告)日:2023-11-17
申请号:CN202011346801.5
申请日:2020-11-26
Applicant: 税友软件集团股份有限公司
IPC: G06Q30/04 , G06F40/279 , G06F16/38
Abstract: 本申请公开了一种发票商品编码赋值方法、系统、装置及计算机可读存储介质,包括:接收货物名称;利用结巴分词和预设的核心词库对所述货物名称进行分词,得到全模式分词结果和精确模式分词结果;利用复合核心词提取算法、所述全模式分词结果和所述精确模式分词结果在所述核心词库中匹配,得到多个匹配结果;利用预先设定的加权占比和所述核心词库中记载的每个匹配结果中的货物商品编码开具公司数量占比,计算出每个匹配结果的置信度;输出置信度最高的匹配结果。本申请利用多种复合算法提取核心词,进行匹配提高了匹配的命中率,得到多种匹配结果,最后利用置信度从中挑选出置信度最高的匹配结果,确保了最终结果的精准度。
-
公开(公告)号:CN111695979A
公开(公告)日:2020-09-22
申请号:CN202010558852.8
申请日:2020-06-18
Applicant: 税友软件集团股份有限公司
IPC: G06Q40/00 , G06F16/901 , G06F16/903 , G06F16/9038
Abstract: 本发明公开了一种原材料与成品的关系分析方法、装置、设备及存储介质,该方法包括:确定需分析的企业为目标企业,目标企业所属的行业为目标行业;依次确定目标企业及目标行业为目标单位,从目标单位的发票中提取原材料及成品,获取提取的原材料及成品间的对应关系,基于该对应关系确定生产各成品所需原材料的配比信息;任意成品与生产该任意成品所需原材料之间具有对应关系;将从目标企业的发票提取的各成品所需原材料的配比信息分别与从目标行业的发票提取的相同成品所需原材料的配比信息进行比对,并基于比对所得结果确定目标企业的发票包含信息是否存在异常。本申请可以确定出企业是否为基于其实际的生产情况来通过发票进行纳税的。
-
-
-
-
-
-
-
-
-