一种PPT文件生成方法、装置、设备及存储介质

    公开(公告)号:CN117350264B

    公开(公告)日:2024-02-23

    申请号:CN202311645411.1

    申请日:2023-12-04

    Abstract: 本申请公开了一种PPT文件生成方法、装置、设备及存储介质,涉及税务领域技术领域,包括:获取用户端上传的待分析文件,并通过预设输入检测算法对所述待分析文件的内容进行检测以确定所述待分析文件的内容格式是否符合目标内容模板的内容格式要求;若不符合且所述待分析文件的内容格式为文本内容或对齐图内容时,调用相应的文件处理算法对所述待分析文件的内容进行处理以得到符合所述内容格式要求的待处理文件;利用预设自动PPT生成算法对所述待处理文件中的内容进行解析并匹配对应的目标PPT模板以得到目标PPT文件。这样一来,使用自动PPT生成算法,用户输入文档自动生成PPT,

    一种PPT文件生成方法、装置、设备及存储介质

    公开(公告)号:CN117350264A

    公开(公告)日:2024-01-05

    申请号:CN202311645411.1

    申请日:2023-12-04

    Abstract: 本申请公开了一种PPT文件生成方法、装置、设备及存储介质,涉及税务领域技术领域,包括:获取用户端上传的待分析文件,并通过预设输入检测算法对所述待分析文件的内容进行检测以确定所述待分析文件的内容格式是否符合目标内容模板的内容格式要求;若不符合且所述待分析文件的内容格式为文本内容或对齐图内容时,调用相应的文件处理算法对所述待分析文件的内容进行处理以得到符合所述内容格式要求的待处理文件;利用预设自动PPT生成算法对所述待处理文件中的内容进行解析并匹配对应的目标PPT模板以得到目标PPT文件。这样一来,使用自动PPT生成算法,用户输入文档自动生成PPT,提高了效率,降低了人力成本,还确保数据的安全性。

    发票商品编码赋值方法、系统、装置及可读存储介质

    公开(公告)号:CN112348604A

    公开(公告)日:2021-02-09

    申请号:CN202011346801.5

    申请日:2020-11-26

    Abstract: 本申请公开了一种发票商品编码赋值方法、系统、装置及计算机可读存储介质,包括:接收货物名称;利用结巴分词和预设的核心词库对所述货物名称进行分词,得到全模式分词结果和精确模式分词结果;利用复合核心词提取算法、所述全模式分词结果和所述精确模式分词结果在所述核心词库中匹配,得到多个匹配结果;利用预先设定的加权占比和所述核心词库中记载的每个匹配结果中的货物商品编码开具公司数量占比,计算出每个匹配结果的置信度;输出置信度最高的匹配结果。本申请利用多种复合算法提取核心词,进行匹配提高了匹配的命中率,得到多种匹配结果,最后利用置信度从中挑选出置信度最高的匹配结果,确保了最终结果的精准度。

    一种大语言模型训练方法、装置、设备及存储介质

    公开(公告)号:CN117332791A

    公开(公告)日:2024-01-02

    申请号:CN202311624845.3

    申请日:2023-11-30

    Abstract: 本申请公开了一种大语言模型训练方法、装置、设备及存储介质,涉及大语言模型领域,包括:获取初始语料数据并进行数据清洗得到目标语料数据,以创建第一训练数据集;将P‑Tuning v2模块嵌入预训练语言大模型的适配器模块,并基于第一训练数据集对适配器模块进行训练;基于第一训练数据集构建第二训练数据集,并在底座大模型中嵌入预设门控模块;基于第二训练数据集对预设门控模块进行训练,在预训练语言大模型收敛后停止训练。通过将P‑Tuning v2模块嵌入预训练语言大模型的适配器模块,和基于前置的门控模块改造预训练的底座模型,将训练流程变成二段式,实现模型动态控制激活适配器参数,达到输出结果更稳定、泛化的目的。

    发票商品编码赋值方法、系统、装置及可读存储介质

    公开(公告)号:CN112348604B

    公开(公告)日:2023-11-17

    申请号:CN202011346801.5

    申请日:2020-11-26

    Abstract: 本申请公开了一种发票商品编码赋值方法、系统、装置及计算机可读存储介质,包括:接收货物名称;利用结巴分词和预设的核心词库对所述货物名称进行分词,得到全模式分词结果和精确模式分词结果;利用复合核心词提取算法、所述全模式分词结果和所述精确模式分词结果在所述核心词库中匹配,得到多个匹配结果;利用预先设定的加权占比和所述核心词库中记载的每个匹配结果中的货物商品编码开具公司数量占比,计算出每个匹配结果的置信度;输出置信度最高的匹配结果。本申请利用多种复合算法提取核心词,进行匹配提高了匹配的命中率,得到多种匹配结果,最后利用置信度从中挑选出置信度最高的匹配结果,确保了最终结果的精准度。

    税收优惠文档特征提取方法、装置、电子设备及存储介质

    公开(公告)号:CN114722151A

    公开(公告)日:2022-07-08

    申请号:CN202210373116.4

    申请日:2022-04-11

    Abstract: 本发明提供一种税收优惠文档特征提取方法、装置、电子设备及存储介质,涉及税务信息处理领域,方法包括:获取税收优惠文档,并对税收优惠文档进行分割,得到初始条款文本;利用第一神经网络模型提取初始条款文本中的税收优惠条款文本;利用预设的特征提取正则表达式和/或第二神经网络模型提取税收优惠条款文本中不同预设特征类型的特征信息;根据预设特征类型将特征信息保存至数据库;可采用正则表达式和神经网络模型提取税收优惠文档中的特征信息,其中正则表达式可提取结构特征较为明显的特征信息,神经网络模型可提取结构较为离散且无明显规律的特征信息,进而有效提升对税收优惠文档中特征信息的提取效率,便于税务领域可用数据集的生成。

    基于直觉模糊集的纳税人利益关联度评估方法

    公开(公告)号:CN104112074A

    公开(公告)日:2014-10-22

    申请号:CN201410336118.1

    申请日:2014-07-15

    Abstract: 本发明提出了一种基于直觉模糊集的纳税人利益关联度评估方法,根据纳税人之间的各类税务数据,包括发票、商品交易、所有权占比等,评估纳税人之间的利益关联程度。该方法将纳税人之间的各类税务数据作为量测数据,根据量测数据自身分布规律进行等级划分;计算各量测数据所属的等级,以及对应的隶属度值和非隶属度值,构造量测数据的直觉模糊集;采用基于Einstein操作的直觉模糊集融合方法对量测数据进行融合计算,得到纳税人利益关联度的直觉模糊集,评估纳税人之间的利益关联程度。本发明能够很好地处理多样的和异构的税务数据,将多样异构的税务数据归一化后进行融合,且不要求多个税务指标数据之间相互独立,具有广阔的适用范围。

    一种税务异常检测方法、装置、设备及介质

    公开(公告)号:CN117710125A

    公开(公告)日:2024-03-15

    申请号:CN202311713465.7

    申请日:2023-12-13

    Abstract: 本申请公开了一种税务异常检测方法、装置、设备及介质,涉及数据挖掘和税务稽查领域,包括:构建初始纳税人特征矩阵和初始交易关系邻接矩阵;构建以纳税人为第一节点集合和以社团为第二节点集合的二部图的初始二部图邻接矩阵以及纳税人的待训练纳税人特征和社团的待训练社团特征;根据图结构学习方法基于上述构建的矩阵和特征训练深度学习模型,得到目标社团特征矩阵和目标二部图邻接矩阵;将目标社团特征矩阵中目标社团特征输入局部异常因子异常检测模型得到每个社团的异常分数,基于目标二部图邻接矩阵确定异常分数大于预设分数的异常社团对应的异常纳税人。能够通过深度学习进行纳税人异常社团检测以及进行重叠社团检测。

    一种多模态文本分类方法、装置、设备及存储介质

    公开(公告)号:CN117576701A

    公开(公告)日:2024-02-20

    申请号:CN202311541863.5

    申请日:2023-11-17

    Abstract: 本申请公开了一种多模态文本分类方法、装置、设备及存储介质,涉及信息技术领域,包括:基于初始图像、初始输入文本及预定义标签确定目标输入文本,根据目标输入文本及目标语言模型获取目标文本特征;基于初始图像及深度残差网络模型获取初始图像特征,利用注意力机制、初始图像特征及目标文本特征筛选目标图像特征;基于目标语言模型获取中间层无类别文本特征,将中间层无类别文本特征及中间层输入文本特征输入至变分自编码器,得到中间层输入文本特征和中间层无类别文本特征对应的均值和方差;基于均值和方差获取权重值,以便利用分类器根据权重值、目标图像特征及目标文本特征对初始输入文本进行分类。本申请优化了对于图像特征的引入机制。

Patent Agency Ranking