基于MapReduce的LBS兴趣点发现方法

    公开(公告)号:CN103729478A

    公开(公告)日:2014-04-16

    申请号:CN201410037999.7

    申请日:2014-01-26

    CPC classification number: G06F17/30241 G06F17/30539

    Abstract: 本发明提供一种基于MapReduce的LBS兴趣点发现方法,涉及计算机信息处理技术。使用MapReduce进行数据变换,得到项集频率降序序列,对事务集按照项集分组降序序列进行分发,在各机器上建立FP-Tree进行挖掘,对增量数据进行变换,对事务集按照增量数据分组进行划分,并行挖掘增量数据。本发明在MapReduce的PFP算法基础上,对增量数据筛选处理,处理部分增量数据,得到所有频繁项集,而不是每次重新挖掘全局数据,建立兴趣点关联规则数据挖掘模型,利用分布式并行化技术提高了关联规则挖掘算法的运行速度,能有效挖掘强关联性的兴趣点数据。

    基于胶囊网络的工业生产表格数据分类预测方法

    公开(公告)号:CN119167234A

    公开(公告)日:2024-12-20

    申请号:CN202411290099.3

    申请日:2024-09-14

    Abstract: 本发明涉及基于胶囊网络的工业生产表格数据分类预测方法,包括:获取待检测的工业生产表格数据,经过预处理后进行特征提取,将提取的特征输入训练后的胶囊网络,得到预测结果。该胶囊网络的训练过程包括:获取带有特定标签的工业生产表格数据,进行特征嵌入,利用多个特征提取器进行不同粒度的特征提取;将嵌入特征和通过多个特征提取器所提取的高级特征进行合并,将合并后的特征编码到初级胶囊中;将初级胶囊的输出信息通过自注意力静态路由机制传递给高级胶囊,进行分类预测,计算边际损失;将所述分类预测结果输入特征重构网络,进行重构,计算重构损失;根据边际损失和重构损失迭代训练胶囊网络。本发明可以明显提高预测结果的准确性。

    基于双规则因果特征选择的疾病因素数据处理方法

    公开(公告)号:CN117352162A

    公开(公告)日:2024-01-05

    申请号:CN202311389736.8

    申请日:2023-10-24

    Abstract: 本发明涉及医疗领域,特别涉及一种基于双规则因果特征选择的疾病因素数据处理方法,本发明将特征选择方法与因果贝叶斯网络结合,通过引入改进的OR规则和AND规则充分挖掘与疾病存在因果关系的疾病危险因素,避免了现有特征选择方法因挖掘错误的因果关系而导致有偏疾病预测输出;本发明通过融合双规则挖掘与疾病具有因果关系的父子特征和配偶特征,解决了当前疾病危险因素挖掘算法存在的假阳性与假阴性错误,并进一步采用分类器进行疾病预测,进而提高疾病诊断系统的精度。

    一种基于惯性动捕的网球击球稳定性评估方法

    公开(公告)号:CN117224921A

    公开(公告)日:2023-12-15

    申请号:CN202311186447.8

    申请日:2023-09-14

    Abstract: 本发明涉及人工智能与运动科学领域,特别涉及一种基于惯性动捕的网球击球稳定性评估方法,包括构建关节点与T帧的骨骼序列时空图,该时空图表示一帧内各关节的三维空间信息以及帧与帧之间节点变化的时间信息;构建的基于图神经网络的动作识别网络,利用该网络对击球类型进行识别;识别出用户的击球类型后,随机选择两个相同类型的击球动作,使用动态时间扭曲算法计算两次击球的最优路径距离;对人体关节节点进行分组,计算每组关节节点的稳定性和权重,并利用权重对该组关节节点稳定性进行加权;将得到的加权稳定性进行百分制转换,得到最终的稳定性评价分数;本发明能够更加准确识别网球动作识别,并且能够击球稳定性评估结果更加准确。

    一种基于表格学习的医疗缺失数据插补方法

    公开(公告)号:CN116913445A

    公开(公告)日:2023-10-20

    申请号:CN202310654968.5

    申请日:2023-06-05

    Abstract: 本发明属于医疗数据处理技术领域,具体涉及一种基于表格学习的医疗缺失数据插补方法;该方法包括:获取待插补的医疗缺失数据并对其进行预处理,得到预处理好的医疗缺失数据;对预处理好的医疗缺失数据分别进行预插补和转换操作,得到初步完整医疗数据和缺失掩码矩阵;采用改进的生成器对初步完整医疗数据和缺失掩码矩阵进行处理,得到修正后的完整医疗数据;将缺失掩码矩阵输入到提示生成器中,得到提示矩阵;采用改进的鉴别器对修正医疗数据和提示矩阵进行处理,得到估计掩码矩阵;计算模型损失并根据模型损失调整模型参数,得到训练好的医疗缺失数据插补模型;本发明插补精度高,插补速度快。

    一种基于知识增强的争议焦点归纳方法及系统

    公开(公告)号:CN115238072A

    公开(公告)日:2022-10-25

    申请号:CN202210854559.5

    申请日:2022-07-15

    Abstract: 本发明涉及一种基于知识增强的争议焦点归纳方法,属于自然语言处理领域,包括以下步骤:S1:根据案件编号获取案件的裁判文书,获取其中的案件ID、原告诉称及被告辩称文本作为案件诉辩文本原始数据集;S2:结合法学知识构建争议焦点关系树,确定争议焦点标签;S3:对原告诉称、被告辩称提及的争议焦点标签分别进行标注,确定该案件是否存在该标签的争议焦点,完成案件争议焦点数据集标注;S4:对原告诉称、被告辩称文本完成人工规则集的构建;S5:用预训练模型BERT‑wwm训练标注好的数据集;S6:将训练好的模型结合规则集约束进行争议焦点的归纳。本发明还提供一种基于知识增强的争议焦点归纳系统。

    一种spark下的机器学习快速大规模样本签名方法

    公开(公告)号:CN111079935B

    公开(公告)日:2022-10-18

    申请号:CN201910983158.8

    申请日:2019-10-16

    Abstract: 本发明请求保护一种spark下的机器学习快速大规模样本签名方法,涉及数据挖掘技术和计算机信息处理技术。本方法为:1)读入样本数据,将样本数据转换成独有的样本格式;2)对样本数据中的高频特征进行划分,得到FeatureMap;3)设置最大广播数量,根据最大广播数量计算FeatureMap的partition;4)根据partition数量进行循环迭代,分片广播大量特征;5)最后对样本进行格式转换,得到libsvm格式的数据。本发明可以解决模型训练过程中样本签名性能瓶颈的问题,特别适用于在spark集群下训练模型。本发明虽然解决的是样本签名问题,但是由于本方法定制数据结构和分片广播可以很好的避免shuffle从而同样适用于大数据工程中的数据倾斜问题。

Patent Agency Ranking