一种推销信息处理装置、相关方法及相关装置

    公开(公告)号:CN110619010A

    公开(公告)日:2019-12-27

    申请号:CN201910899851.7

    申请日:2019-09-23

    Abstract: 本申请公开了一种推销信息处理装置,包括:训练数据获取模块,用于对获取到的预设维度内的企业信息数据进行数据预处理,得到训练数据;模型训练模块,用于采用随机森林算法对训练数据和对应的软件使用信息进行训练处理,得到兴趣点识别模型;推销信息获取模块,用于根据兴趣点识别模型对待推销企业信息数据进行识别处理,得到对应的兴趣点推销信息。通过获取到的企业信息数据进行随机森林算法的训练处理,得到兴趣点识别模型,最后采用该兴趣点识别模型对待推销企业信息数据进行处理,得到兴趣点推销信息,提高了推荐的效果。本申请还公开了一种推销信息处理方法、服务器以及计算机可读存储介质,具有以上有益效果。

    一种数据表处理方法、装置、设备及介质

    公开(公告)号:CN109710702A

    公开(公告)日:2019-05-03

    申请号:CN201811623238.4

    申请日:2018-12-28

    Abstract: 本发明公开了一种数据表处理方法、装置、设备及介质。该方法的步骤包括:获取数据集市中的原始数据表;在原始数据表中提取目标数据项的数据内容,并将数据内容写入至预设的新数据表;其中,目标数据项为执行数据分析操作所需的数据项,新数据表的结构中包含有目标数据项;将新数据表设置为执行数据分析操作时读取的数据表。本方法相对减少了对数据集市中的数据表进行数据分析时计算设备需要读取的数据内容总量,进而相对减少了计算设备的资源开销。此外,本发明还提供一种数据表处理装置、设备及介质,有益效果同上所述。

    一种工资条项目识别方法、装置、设备及可读存储介质

    公开(公告)号:CN109543668A

    公开(公告)日:2019-03-29

    申请号:CN201811444735.8

    申请日:2018-11-29

    Abstract: 本发明公开了一种工资条项目识别方法,该方法包括以下步骤:获取目标工资条的项目序列,并对项目序列进行清洗,获得目标项目序列;利用完全匹配字典、模糊匹配字典和TF-IDF分别对目标项目序列中的各个字段分别进行加权,获得完全加权矩阵、模糊加权矩阵和TF-IDF加权矩阵;对完全加权矩阵、模糊加权矩阵和TF-IDF加权矩阵进行矩阵拼接,获得综合加权矩阵;将综合加权矩阵中各个字段的向量输入至分类器中进行识别,获得识别结果。可提高工资条项目识别的准确率。本发明还公开了一种工资条项目识别装置、设备及可读存储介质,具有相应的技术效果。

    一种业务标签计算方法、系统、设备及计算机存储介质

    公开(公告)号:CN108052657A

    公开(公告)日:2018-05-18

    申请号:CN201711460524.9

    申请日:2017-12-28

    Abstract: 本发明公开了一种业务标签计算方法、系统、设备及计算机存储介质,其中该方法包括:将每一个业务标签对应的位图进行分段,得到分段位图;查找每一个待计算纳税人对应的分段位图;分别对属于同一待计算纳税人的分段位图进行计算,得到相应的计算结果。本发明提供的一种业务标签计算方法实现了仅对待计算纳税人的分段位图进行相应计算,与现有技术中对业务标签的整个位图进行计算相比,计算效率较高,适用性较好。综上所述,本发明公开的一种业务标签计算方法在一定程度上解决了如何提高现有的一种运用位图技术对业务标签进行计算的方法的适用性的技术问题。本发明公开的一种业务标签计算系统、设备及计算机存储介质也解决了相应的技术问题。

    一种数据写入方法及装置、数据读取方法及装置

    公开(公告)号:CN103500224A

    公开(公告)日:2014-01-08

    申请号:CN201310493539.0

    申请日:2013-10-18

    CPC classification number: G06F17/30339

    Abstract: 本申请提供了一种数据写入方法及装置、数据读取方法及装置,其中,数据写入方法包括:对包含多条第一数据记录的待写入数据进行分块,待写入数据为依据各条第一数据记录的序号对多条第一数据记录进行排序后得到的数据,分块的数量小于待写入数据中第一数据记录的条数;针对数据块中的目标数据块,对目标数据块进行数据压缩,将目标数据块中第一数据记录的最大序号和最小序号以及压缩后的数据作为第二数据记录写入数据库服务器的数据表中,直至待写入数据的第一数据记录全部写入所述数据库服务器的数据表中。本申请提高了数据存储速度,并且节省了数据库服务器的存储空间。

    一种会计凭证拆分方法、装置、设备及可读存储介质

    公开(公告)号:CN110659291A

    公开(公告)日:2020-01-07

    申请号:CN201910894856.0

    申请日:2019-09-20

    Abstract: 本申请公开了一种会计凭证拆分方法,包括:获取多借多贷类型的电子会计凭证,并为电子会计凭证中的每条账目构建对应的第一索引;将具有相同第一索引的账目分类至同一个第一凭证组,获得多个第一凭证组;若第一凭证组中的账目为一借一贷类型、一借多贷类型或一贷多借类型,且符合相应的借贷平衡条件,则将第一凭证组存储为电子会计凭证的拆分结果。本申请能够将多借多贷类型的电子会计凭证自动拆分为一借一贷类型、一借多贷类型或一贷多借类型的凭证,从而可为审计员或查账人员的工作带来方便,也降低了查账难度,提高了查账效率和准确性。相应地,本申请公开的一种会计凭证拆分装置、设备及可读存储介质,也同样具有上述技术效果。

    一种目标社群数据的识别方法及相关装置

    公开(公告)号:CN110647590A

    公开(公告)日:2020-01-03

    申请号:CN201910899829.2

    申请日:2019-09-23

    Abstract: 本申请公开了一种目标社群数据的识别方法,包括:将获取到的多个对象的交易关系数据进行交易关系网络构建处理,得到交易关系网络;基于模块度的图聚类算法对所述交易关系网络进行社群分类,得到社群分类结果;根据目标社群的属性确定分析维度,通过所述分析维度对所述社群分类结果进行分析,得到目标社群数据。通过基于模块度的图聚类算法对交易关系网络进行社群分类,得到社群分类结果,再筛选出目标社群数据,提高了目标社群数据查找的精度和准确率,提高了目标社群识别的效果。本申请还公开了一种目标社群数据的识别装置、服务器以及计算机可读存储介质,具有以上有益效果。

    一种信用积分预测的方法、系统及相关装置

    公开(公告)号:CN109615232A

    公开(公告)日:2019-04-12

    申请号:CN201811520585.4

    申请日:2018-12-12

    Abstract: 本申请所提供的一种信用积分预测的方法,包括:根据预设的各个指标的重要性程度,利用XGBOOST算法从所有企业的指标数据中提取出各个目标指标;在分别获取到各个类别所有企业的目标指标对应的数据集后,利用回归算法对目标类别所有企业对应的数据集进行模型训练,得到回归算法对应的回归模型;将任一目标类别企业的历史数据输入回归模型,得到目标类别企业的信用积分预测结果。可见,该方法利用目标类别所有企业对应的数据集训练出的回归模型,进行目标类别企业的信用积分的预测,能够提高信用积分预测的准确性。本申请还提供一种信用积分预测的系统、设备及计算机可读存储介质,均具有上述有益效果。

    发票商品名分类方法、系统、设备及计算机可读存储介质

    公开(公告)号:CN107871144A

    公开(公告)日:2018-04-03

    申请号:CN201711191699.4

    申请日:2017-11-24

    CPC classification number: G06K9/6257 G06K9/6267

    Abstract: 本申请公开了一种发票商品名分类方法、系统、设备及计算机可读存储介质,该方法包括:根据预设规则,确定待分类发票商品名的商品名向量;将所述商品名向量输入至预先创建的目标训练后模型,得到所述目标训练后模型输出的发票商品名类型,以判断该类型是否为目标类型;其中,所述目标训练后模型为预先利用目标训练样本对基于梯度增强决策树XGBoost模型构建的待训练模型进行训练后得到的模型,其中,所述目标训练样本包括已标注目标发票商品名类型的训练样本以及根据Rocchio算法获取到的未标注商品名类别的训练样本。使用本发明提供的一种发票商品名分类方法,可以降低人工成本,同时还可以显著地提高分类结果的准确率。

    一种实时扫描税务业务数据的方法及装置

    公开(公告)号:CN107832278A

    公开(公告)日:2018-03-23

    申请号:CN201711193504.X

    申请日:2017-11-24

    CPC classification number: G06F17/2264 G06Q40/123

    Abstract: 本发明公开了一种实时扫描税务业务数据的方法,包括:将税务标准业务报文解析为业务数据;利用与业务数据对应的运行规则,对业务数据及历史数据进行分析,得到分析结果,并反馈至外部系统;其中,所述运行规则为通过标准语义字符串转换的可执行代码的运行规则;可见,在本方案中,对税务业务数据进行分析识别时,不仅仅根据纳税人当前业务办理提交的数据,还需要通过运行规则对纳税人当前业务办理提交数据以及该户纳税人历史业务办理数据进行综合比对,从而有效的识别各类数据质量问题,有效降低纳税人涉税风险提高整体数据质量;本发明还公开了一种实时扫描税务业务数据的装置、设备及计算机可读存储介质,同样可以实现上述技术效果。

Patent Agency Ranking