一种文档数据库多表连接查询方法及装置

    公开(公告)号:CN117349321B

    公开(公告)日:2024-03-05

    申请号:CN202311643055.X

    申请日:2023-12-04

    Abstract: 本发明公开了一种文档数据库多表连接查询方法及装置,涉及数据处理技术领域。该方法的一具体实施方式包括:基于数据表的连接关系确定连接模式;将上述连接模式中的数据表转换为引用表,采用连接键作为分片键,对上述引用表进行分片;将分片后的引用表分布在分布式集群中的每个节点中;将查询指令分布至上述分布式集群中的节点上,并基于查询指令进行数据查询;汇总上述分布式集群中的每个节点的查询结果,生成总查询结果并进行反馈。该实施方式通过将连接键作为引用表的分片键,具有数值接近的分片键的文档位于相同分片,将分片平均分布至不同的节点中,使得在进行查询时,每个节点只需要对本地的数据进行查询,提高了数据读取效率。

    基于增量式分区策略的MapReduce数据均衡方法

    公开(公告)号:CN106126343B

    公开(公告)日:2020-04-03

    申请号:CN201610480210.4

    申请日:2016-06-27

    Inventor: 陈群 房超 王卓

    Abstract: 本发明提出了基于增量式分区策略的MapReduce数据均衡方法。具体为首先在Map端产生多于Reducer个数的微分区,微分区的负载统计被持续收集并且发送给决策者,在每一个决策点,优化的马尔科夫模型在未被分配的微分区中自动进行分区选择,然后利用分配算法将选中的微分区分配到各Reducer上;依照此方法,经过多次分区选择和分配,最终在执行Reduce函数前,将所有微分区分配到Reduce端,该方法使得数据划分更加均衡,有效避免了数据倾斜所带来的负载不均衡问题。

    一种面向实体解析任务的风险分析方法

    公开(公告)号:CN110516950A

    公开(公告)日:2019-11-29

    申请号:CN201910773251.6

    申请日:2019-08-21

    Abstract: 本发明针对实体解析任务,通过决策树来生成作为风险特征的规则;对于每个风险特征,假设其匹配概率服从各自的正态分布,其中包含了三个可调参数,期望,方差和特征的重要度;给定任一记录对,其匹配概率的分布则是该记录对符合的所有风险特征所对应的正态分布的加权叠加;对于给定的记录对,得到其匹配概率的正态分布和机器标签后,采用风险值来评估机器标签的风险;风险特征的匹配概率的期望根据分类器训练数据集所提供的匹配频率统计提供,方差和特征的重要度权重则是在风险训练数据集上,采用学习排序技术和梯度下降优化方法来学习它们的最优值。风险模型训练完成后,输入任一记录对的机器标签,风险模型返回该标签的风险值。

    一种物品遗忘智能提醒装置

    公开(公告)号:CN105701995B

    公开(公告)日:2018-02-09

    申请号:CN201610163981.0

    申请日:2016-03-22

    Abstract: 本发明公开了一种物品遗忘智能提醒装置,通过红外线传感器检测人是否离开感应区的状态,机械模块和加速度计检测模块配合使用以检测是否悬挂物品;机械模块中的轴承固定在箱体侧壁上,旋转轴与轴承配合,两复位弹簧一端分别固定在箱体上,另一端连接在旋转轴同轴径向两侧,垂线旋绕旋转轴穿过安全塞与箱体外侧挂钩连接;将物品挂在挂钩处后,通过中央处理模块根据传感器输入信息判断是否有遗忘物品的情况,如有遗忘,通过语音模块循环播报提醒语音信息。物品遗忘智能提醒装置反应迅速,提醒及时,可避免随身物品的遗失而带来的经济损失。物品遗忘智能提醒装置适用于宾馆、机场卫生间、洗漱台或试衣间多种场所。

    基于语义相关的XML文档关键字检索排序方法

    公开(公告)号:CN102081660A

    公开(公告)日:2011-06-01

    申请号:CN201110007177.0

    申请日:2011-01-13

    Abstract: 本发明公开了一种基于语义相关的XML文档关键字检索排序方法,依次解析XML文档,计算主题节点与属性节点的语义相关度、属性节点与关键字的语义相关度,优化检索时间,对所输入的查询关键字进行单词归根处理,在倒排索引中取出关键字对应的主题节点信息以及相关度信息,对距离关键字最近的主题进行检索,对检索结果进行相关度从高到低排序,对距离关键字次近的主题进行检索,根据结果的Dewey码返回信息片段给用户。本发明针对XML数据独有的结构语义特点,提出了SRank相关度检索模型及方法,可以提高检索结果的准确率。

    一种数据片段处理时间计算方法及装置

    公开(公告)号:CN117312761B

    公开(公告)日:2024-03-05

    申请号:CN202311597815.8

    申请日:2023-11-28

    Abstract: 本发明公开了一种数据片段处理时间计算方法及装置,涉及数据处理技术领域。该方法包括:接收数据片段,标识数据片段的处理开始时间;对每个数据片段的数据准备过程进行子任务划分,并基于每个子任务进行数据准备;响应于数据准备完成,确定每个子任务的结束标识数据,并将其他数据作为非结束标识数据;采用统计算子获取目标数据片段的结束标识数据和非结束标识数据,分别计算结束数据量和计算数据量;获取目标数据片段的处理开始时间;基于目标数据片段的结束数据量和计算数据量,以及目标数据片段的处理开始时间,计算目标数据片段的处理时间。该实施方式降低了处理时间计算的复杂性,解决了处理时间计算过程中不同节点的时钟偏差问题。

    一种卫星天线环形阵列可展单元结构

    公开(公告)号:CN105071013A

    公开(公告)日:2015-11-18

    申请号:CN201510526215.1

    申请日:2015-08-25

    Abstract: 本发明公开了一种卫星天线环形阵列可展单元结构,采用多个相同的单元构成环形可展阵列;每个单元由相同结构的二个水平杆组件、二个中间杆组件、二个对角杆组件组成,水平杆组件和对角杆组件与中间杆组件铰接,形成可伸缩的四边形单元结构,相邻单元之间通过共用的中间杆组件连接;单元结构利用其几何尺寸的比例关系达到收缩和展开的要求,且可展环形阵列只有一个自由度,易于驱动和控制。可展环形阵列展开过程稳定性好,展开精度高,同步性好。单元结构零部件种类少,加工精度要求低,装配简单便捷;在不改变各零部件的结构和尺寸的情况下,单元的数量可根据不同情况和工作环境的需求,任意增加或减少,各零部件可重复使用。

Patent Agency Ranking