一种利用二叉查找树的数据排名的检索、数据处理的方法和系统

    公开(公告)号:CN109815232B

    公开(公告)日:2022-03-18

    申请号:CN201811613883.8

    申请日:2018-12-27

    Abstract: 公开了一种利用二叉查找树的数据排名的检索、数据处理的方法和系统,其包括对二叉查找树增加子树大小size和访问次数freq;若当前节点的key与待查找的key的大小相等,待查找的key的排名为rank‑Node.left.size,对当前节点的访问次数加1,若当前节点key小于待查找的key,向右子树方向查找,排名上升,即当前节点右子树方向的最小节点的排名值为rank R等于rank‑1‑Node.left.size,若当前节点key大于待查找的key,向左子树方向查找,排名不变,直至查找完成后,若当前节点的访问次数小于左子树或右子树节点的访问次数,把当前节点与左子树或右子树节点位置进行置换。利用将访问次数多的节点尽可能移到更接近根节点的位置,提高频繁查询节点的查询效率,从而提高整个系统的检索效率。

    一种自动分析服务号码的方法和装置

    公开(公告)号:CN109857773B

    公开(公告)日:2022-03-01

    申请号:CN201811573549.4

    申请日:2018-12-21

    Abstract: 本发明提供了一种自动分析服务号码的方法和装置。所述方法包括:基于所述通联数据提取通联对象特征,得到通联对象的数据集;根据预定条件对所述通联对象的数据集进行分类,得到分析集合;对所述分析集合中的通联对象数进行高斯分布计算,得到所述分析集合的正态分布;根据所述分析集合中的通联对象数在所述分析集合的正态分布中的位置判断所述数据集是否为服务号码。根据本发明的方法和装置,能够克服时间差异、个体差异等特性而引发的服务号码无法匹配的问题,实现服务号码的自动分析和提取。

    一种索引数据存储及检索方法、装置及存储介质

    公开(公告)号:CN109325032B

    公开(公告)日:2020-10-27

    申请号:CN201811091065.6

    申请日:2018-09-18

    Abstract: 本发明提供了一种索引数据存储及检索方法、装置及存储介质,数据存储方法在数据(即键值对)存储时,不仅根据值元素的大小进行排序,还将排序的数据序列划分为多个段,每个段将键值排序,并将数据序列与键值排序对应存储,实现值元素和键值(也称为记录编号)都有序存储,即构建了全新的索引结构,并提出了适于该索引结构的多条件检索方法,其对于任意的区间查询,结果集都可以用一个或者多个集合的并集来表示,并且这些集合大部分有序的,最多边界两个集合是无序的,从而提高了在多个条件查询时进行与、或、非等运算的效率。

    生成类别向量的方法和装置

    公开(公告)号:CN111783858A

    公开(公告)日:2020-10-16

    申请号:CN202010567257.0

    申请日:2020-06-19

    Abstract: 本申请实施例公开了生成类别向量的方法和装置。该方法的一具体实施方式包括:获取第一预设数量个属于预设类别的向量作为第一向量集;获取第二预设数量个属于预设类别的向量作为第二向量集;从第二向量集中确定符合预设条件的目标向量;获取属于预设类别的待替换向量;确定待替换向量是否符合预设替换条件,如果符合,将目标向量替换为待替换向量;基于第一向量集和进行向量替换后的第二向量集,确定表征预设类别的类别向量并存储。该实施方式实现了实时地对第二向量集进行更新,使第二向量集中的向量对预设类别的代表性逐渐增强,提高生成类别向量的精确性。

    基于动态评估的数据探查方法和装置

    公开(公告)号:CN111581431A

    公开(公告)日:2020-08-25

    申请号:CN202010351013.9

    申请日:2020-04-28

    Abstract: 本发明公开了一种基于动态评估的数据探查方法和装置,通过根据数据源的类型和探查维度调用探查引擎对数据源进行数据探查,得到第一探查结果;对第一探查结果进行评估,得到评估结果,根据评估结果对探查流程进行动态调整,获得动态匹配的探查规则,并通过探查规则获得第二探查结果;计算第二探查结果的有效探查项比例,根据有效探查比例判断探查规则的有效性,对第二探查结果进行确认以获得最终探查结果。通过动态调整数据探查的操作路径,实现不同类型数据的自动探查工作,提高数据探查的工作效率,结合不同的数据源和探查结果,智能推荐探查结果,实现所有接入数据源的自动探查工作,高效支撑各种不同数据源的探查,提升大数据智能化接入效率。

    一种身份识别的数据归一方法、装置及介质

    公开(公告)号:CN110825717A

    公开(公告)日:2020-02-21

    申请号:CN201910959733.0

    申请日:2019-10-10

    Abstract: 本发明提供了一种身份识别的数据归一方法、装置及介质,该方法首先构建对应的身份属性数据集;然后判断是否存在识别身份属性数据集的匹配规则,如果是,使用规则匹配方法对身份属性数据集进行识别,如果否,使用路径匹配方法对身份属性数据集进行识别;再对获得的识别结果中的至少两条数据记录进行可信度计算,如果可信度达到一定阈值,则将所述至少两条数据记录进行归一操作后保存在数据库中。本发明根据数据记录的不同特点,自适应的选择使用规则匹配算法还是使用路径匹配算法,能够快速将符合规则特征的身份归一化,还能够更全面将无明显一致特征的身份进行归一化,这种方法将极大提高身份归一的准确性,并提出了规则匹配算法及路径匹配算法。

    一种基于节点集合的多层管理系统

    公开(公告)号:CN106059798B

    公开(公告)日:2019-10-01

    申请号:CN201610328707.4

    申请日:2016-05-18

    Abstract: 本发明公开了一种基于节点集合的多层管理系统。该系统包括:形成树形结构的多个节点,其中,在树形结构中包括至少由一个节点构成的分组,一个分组中的节点隶属于同一个父亲节点且具有相同属性;以及设置于节点上的管理装置,其中,管理装置用于对一个或多个分组,或一个分组中的多个节点下发批量操作命令。通过本发明,在面临机器繁多、环境复杂的情况,能够提供一种灵活的但又定制化高的方式。

    基于消息队列的数据处理方法、装置、系统及存储介质

    公开(公告)号:CN110209507A

    公开(公告)日:2019-09-06

    申请号:CN201910407305.7

    申请日:2019-05-16

    Abstract: 本发明提供了一种基于消息队列的数据处理方法、装置、系统及存储介质,所述方法包括:获取至少一个源数据库的源数据;将所述源数据存储至消息传输队列,并将所述消息传输队列通过消息通道发送至目标消息队列;基于所述目标消息队列得到相应的源数据,将所述相应的源数据存储至对应的目标数据库。根据本发明的方法、装置、系统及存储介质,使得数据源库与数据仓库之间通信解耦,实现高效率的数据汇聚,将不同来源的数据集成起来,统一数据的通信规范,让数据发挥更大的效益。

    一种数据分发方法、装置、系统及存储介质

    公开(公告)号:CN110175210A

    公开(公告)日:2019-08-27

    申请号:CN201910346093.6

    申请日:2019-04-26

    Abstract: 本发明提供一种数据分发方法、装置、系统及存储介质,所述方法包括:获取来自至少一个数据源的原始数据;基于生成规则对所述原始数据进行处理生成待分发数据;根据分发规则向对应的目标分发所述待分发数据;其中,所述生成规则包括根据所述分发规则生成所述待分发数据的目标编号。根据本发明的方法、装置、系统及计算机存储介质,通过将数据生成规则和分发规则有效地结合,实现对于不同结构的多源化数据的分发配置耦合度低、灵活、扩展性和通用度高,以提高数据开发的使用效率,更好地满足客户需求。

    可定制化的多源数据库的数据抽取方法、装置及存储介质

    公开(公告)号:CN110032594A

    公开(公告)日:2019-07-19

    申请号:CN201910218315.6

    申请日:2019-03-21

    Abstract: 本发明提供了一种可定制化的多源数据库的数据抽取方法、装置及存储介质,该方法包括:获取数据抽取系统的当前时间,作为数据抽取的开始时间;从ETL的日志表中的到当前的最小FLAG作为抽取数据起始点;接收输入的数据抽取策略,所述抽取策略包括待抽取的数据源;在待抽取的数据源中从抽取数据起始点基于数据抽取策略进行数据的抽取,抽取完成后将抽取记录到日志表。本发明提出了数据抽取系统,租户向该平台提交数据抽取需求后,经管理员审批通过,所述服务服务提供商完成数据的抽取并反馈至租户,这样租户就不再需要维护独立的数据抽取系统,提高了系统性能,且数据的抽取过程可通过审批机制提高数据系统的安全性。

Patent Agency Ranking