一种业务交互网络的预测方法及装置

    公开(公告)号:CN114519445B

    公开(公告)日:2025-02-18

    申请号:CN202011294355.8

    申请日:2020-11-18

    Abstract: 本公开涉及数据处理技术领域,尤其涉及一种业务交互网络的预测方法及装置,解决建立的业务交互网络不完整,以及无法对潜在的业务关系进行预测的问题,方法为:获取采集的各个业务数据,建立交互网络,再建立邻接矩阵和特征矩阵,再将所述邻接矩阵和所述特征矩阵,输入预测模型,得到业务交互预测矩阵,然后将所述业务交互预测矩阵中元素进行处理后,生成业务交互网络矩阵,并基于所述业务交互网络矩阵确定预测的业务交互网络。这样,采用业务数据生成的交互网络,预测业务交互网络,规避建立预测交互网络时,需要检索确定同种业务类型的全部交互对象,使得建立的业务交互网络不完整的弊端,而且能够预测出存在潜在交互可能的交互对象。

    一种企业的评估方法、装置、存储介质和电子设备

    公开(公告)号:CN112241914B

    公开(公告)日:2024-11-05

    申请号:CN202011063041.7

    申请日:2020-09-30

    Abstract: 本公开涉及一种企业的评估方法、装置、存储介质和电子设备,针对多个待评估企业中的每一个待评估企业,基于该待评估企业的税务数据中不同的业务数据信息,对该待评估企业建立至少两个不同的关联企业网络,并确定出该待评估企业在每个所述关联企业网络中的权重;根据该待评估企业在每个所述关联企业网络中的权重,对该待评估企业的至少两个不同的关联企业网络进行自适应网络融合处理,获取该待评估企业的网络融合后的数据信息;利用该待评估企业的网络融合后的数据信息通过随机游走模型,得到所述该待评估企业的重要性权重;根据每个所述待评估企业的重要性权重,对所述多个待评估企业进行评估。本公开用以提高企业重要性评估的准确性。

    食品检验检测项目预知方法及装置

    公开(公告)号:CN111242170B

    公开(公告)日:2023-07-25

    申请号:CN201911415857.9

    申请日:2019-12-31

    Abstract: 本发明公开食品检验检测项目预知方法及装置。该方法,包括:获取用户输入的待检测食品名称;利用预先设定的分词工具,生成所述待检测食品名称对应的词列表;利用所述词列表,遍历预先设定的词库,确定与所述待检测食品名称对应的数值向量;将所述数值向量转换成libsvm格式,作为待分类的特征向量;根据所述待分类的特征向量,利用预先确定的线性多分类模型,确定所述待检测食品名称对应的食品细类编号;根据所述食品细类编号,从预先确定的检验检测标准体系中查询得到对应的至少一项检验检测项目。该方法能够根据输入的食品名称,预知食品检验检测项目,速度快、准确性高。

    一种基于改进聚类和Spark框架的个性化推荐方法及系统

    公开(公告)号:CN110020141A

    公开(公告)日:2019-07-16

    申请号:CN201711132268.0

    申请日:2017-11-15

    Inventor: 刘芬

    Abstract: 本发明公开了一种基于改进聚类和Spark框架的个性化推荐方法,包括:确定有效的评分数据集;利用Canopy算法对项目进行聚类预处理,生成至少一个Canopy聚类中心;初始化FCM算法的聚类中心,对每个项目利用隶属度计算公式更新其对聚类中心的隶属度,并根据更新的隶属度更新聚类中心,迭代直至满足停止条件,确定最终聚类集合;分别计算目标项目与最终聚类集合中每个聚类中心的相似度,选取大于等于预设相似度阈值的相似度对应的聚类集合中的项目组成候选项目空间,计算目标项目与候选项目空间中各个项目之间的相似度,寻找目标项目的K最近邻集合;获取用户对目标项目的偏好预测值,并利用top-N推荐方法选取偏好预测值较高的N个项目进行推荐。

    一种基于轻量化模型的文档数据处理系统和方法

    公开(公告)号:CN119964184A

    公开(公告)日:2025-05-09

    申请号:CN202411980143.3

    申请日:2024-12-31

    Abstract: 本发明提供一种基于轻量化模型的文档数据处理系统和方法,包括:文档转换模块,用于将待处理的文档转换为图片文件;版面分析模块,用于根据预先构建的版面分析轻量化模型,对所述图片文件进行处理,提取所述图片文件中的每个标签的类别和区域坐标;版面还原模块,用于根据每个标签的类别和区域坐标,对不同类别的标签区域分别进行解析处理,获得每个标签区域对应的内容;通过将每个标签区域对应的内容组合,获得待处理的文档的全部内容;文本切分模块,用于通过分割器将所述待处理的文档的全部内容,切分成预设大小的文本块,完成所述待处理的文档的格式转化和文档数据处理。实现了PDF格式文档中图形、表格及文字的快速识别及分离。

    一种基于发票数据分析的疑似税务异常企业筛选方法

    公开(公告)号:CN111783577B

    公开(公告)日:2023-11-10

    申请号:CN202010566093.X

    申请日:2020-06-19

    Abstract: 本发明提供一种基于发票数据分析的疑似税务异常企业筛选方法,包括:对发票数据进行特征提取,得到特征向量;修改支持向量机模型,将最小间隔分离超平面设置为分类超平面;将特征向量作为一次修改支持向量机模型训练样本,得到包含正样本和负样本的一类训练样本;采用一类训练样本对一次修改支持向量机模型进行迭代训练,直至将负样本与正样本完全分离;将一次修改支持向量机模型修改为层次型支持向量机模型;采用带有标记的正样本和负样本对二次修改支持向量机模型进行训练,得到所述疑似税务异常企业筛选模型;根据该模型对异常发票进行筛选,确定疑似税务异常企业。与现有基于机器学习的疑似税务异常企业筛选方法相比,本发明的准确率更高。

    一种业务交互网络的预测方法及装置

    公开(公告)号:CN114519445A

    公开(公告)日:2022-05-20

    申请号:CN202011294355.8

    申请日:2020-11-18

    Abstract: 本公开涉及数据处理技术领域,尤其涉及一种业务交互网络的预测方法及装置,解决建立的业务交互网络不完整,以及无法对潜在的业务关系进行预测的问题,方法为:获取采集的各个业务数据,建立交互网络,再建立邻接矩阵和特征矩阵,再将所述邻接矩阵和所述特征矩阵,输入预测模型,得到业务交互预测矩阵,然后将所述业务交互预测矩阵中元素进行处理后,生成业务交互网络矩阵,并基于所述业务交互网络矩阵确定预测的业务交互网络。这样,采用业务数据生成的交互网络,预测业务交互网络,规避建立预测交互网络时,需要检索确定同种业务类型的全部交互对象,使得建立的业务交互网络不完整的弊端,而且能够预测出存在潜在交互可能的交互对象。

    非正常纳税人识别方法及装置

    公开(公告)号:CN109858922A

    公开(公告)日:2019-06-07

    申请号:CN201811584029.3

    申请日:2018-12-24

    Abstract: 本发明公开了一种非正常纳税人识别方法及装置,该方法包括:获取待识别纳税人的选定信息;从所述待识别纳税人的选定信息中获取所述待识别纳税人的至少一个选定特征的特征值;将所述待识别纳税人的至少一个选定特征的特征值依次输入第一设定数量的训练后的xgboost模型中,得到所述待识别纳税人的第一设定数量的概率值;基于所述待识别纳税人的第一设定数量的概率值得到所述待识别纳税人的识别结果。该方案可以实现借助机器学习算法和大数据技术,来构建非正常纳税人识别模型来识别纳税人是否正常。

    一种用于大语言模型的财税训练数据处理方法及系统

    公开(公告)号:CN120030342A

    公开(公告)日:2025-05-23

    申请号:CN202411915892.8

    申请日:2024-12-24

    Abstract: 本发明公开了一种用于大语言模型的财税训练数据处理方法及系统,包括:对用于财税训练的财税数据进行采集,以获取原始财税数据;对所述原始财税数据进行数据预处理,并对数据预处理后得到的财税处理数据进行探查,以多维度的对财税处理数据进行打标分类,以获取财税标签数据;根据训练任务的类型的不同,基于所述财税标签数据进行初始训练数据的构建;对所述初始训练数据进行质量检测,以获取满足训练需求的用于大语言模型训练的财税训练数据。本发明的方法从数据采集到最后的数据质检,实现全流程的数据构建策略,解决财税行业高质量训练数据难以构建的问题;并通过持续更新的流水线作业,保障大模型的训练数据紧跟财税法规政策变化情况,避免产生过时的判断及回复。

    一种信息处理方法、装置、电子设备和存储介质

    公开(公告)号:CN119441408A

    公开(公告)日:2025-02-14

    申请号:CN202411562583.7

    申请日:2024-11-04

    Abstract: 本申请涉及人工智能领域,尤其涉及自然语言处理技术领域,提供一种信息处理方法、装置、电子设备和存储介质,提高大语言模型问答结果的准确性。方法包括:接收对象输入的目标问题;将目标问题输入已训练的分类模型中,获取目标问题所属的问题意图;根据问题意图,确定与目标问题对应的处理流程;其中,若问题意图为第一类意图,则处理流程为对目标问题进行中间处理后,将中间处理结果输入财税大模型;若问题意图为第二类意图,则处理流程为将目标问题直接输入财税大模型;将财税大模型的输出结果作为目标问题的答案。由于本申请对目标问题通过分类模型进行分类,可简单高效实现问题意图识别,提高大语言模型问答结果的准确性。

Patent Agency Ranking