一种基于自适应高斯混合模型的海上漂浮物轨迹预测方法

    公开(公告)号:CN108334897A

    公开(公告)日:2018-07-27

    申请号:CN201810060430.0

    申请日:2018-01-22

    Abstract: 本发明涉及机器学习领域,提出了一种海洋轨迹聚类及预测的方法。为了准确预测未来的轨迹点需要先进行轨迹聚类。本发明轨迹聚类方法主要是将海上复杂多变性和强波动性的轨迹点进行相似性度量,挖掘其中潜在的数据信息。该方法将高斯混合模型GP与狄利克雷过程DP相结合,利用DP的非参贝叶斯框架,确定聚类数目提高聚类自适应性。算法采用在DP基础上加入中国餐馆过程,采用坍塌的Gibbs sampling方法进行模型求解,实现了由有限混合模型到无限混合模型的无监督分类,可自动获取聚类数目,对已聚类的轨迹通过高斯过程回归预测方法预测未来的轨迹点。本发明避免了人工指定聚类数目和参数估计时局部最大化的弊端,在保证自适应聚类的前提下,提高预测的准确率。

    基于定向加权关联规则模型的散发性结直肠腺瘤的危险因素筛查方法

    公开(公告)号:CN111863266B

    公开(公告)日:2023-09-19

    申请号:CN202010057865.7

    申请日:2020-01-16

    Abstract: 本发明公开了一种基于定向加权关联规则模型的散发性结直肠腺瘤的危险因素筛查方法,属于数据挖掘领域。本发明先对数据进行了预处理;然后,采用随机森林的平均不纯度减少的特征选择方法进行特征提取,采利用信息增益来确定最优划分节点,得到优选特征集合;接着,将优选特征集合输入定向加权关联规则模型,生成强关联规则。最后,将强关联规则中蕴含的危险因素纳入危险因素集合,并与专家交流。本发明与现有技术相比,主要提供了定向加权关联规则模型来筛查结直肠腺瘤的危险因素,肯定了生活饮食习惯因素在结直肠腺瘤病因学中的重要意义,发现了此前研究中未被发现的高危因素,为寻找结直肠腺瘤危险因素提供了一套值得借鉴的方法。

    一种基于中文文本分析的社交网络用户人格预测方法

    公开(公告)号:CN109635207A

    公开(公告)日:2019-04-16

    申请号:CN201811553414.1

    申请日:2018-12-18

    CPC classification number: G06Q50/01 G06F17/2775

    Abstract: 一种基于中文文本分析的社交网络用户人格预测方法,通过对用户在社交网络上近一段时间所发布的中文文本数据进行处理,将文本分为用户基本状态信息、用户互动信息、用户文本信息三类。对文本数据进行预处理,得到由各类词构成的数据集;基于情感词典对文本数据进行词性标注,计算各类词性在文本中的出现频率,组合优化用户的以上三类信息,并基于专家量表对用户进行测验的结果作为事实数据,构造数值化的数据集;对得到的数据集进行特征工程,将得到用于人格预测的特征要素集,基于BP神经网络训练得到人格预测模型,通过该模型实现社交网络用户的人格预测。本发明具有数据采集方便、不依赖心理学专家经验、无须耗费人力物力,精确度高的优点。

    基于随机森林和梯度提升树的预测污水出水指标的方法

    公开(公告)号:CN109408774B

    公开(公告)日:2022-11-08

    申请号:CN201811323416.1

    申请日:2018-11-07

    Abstract: 本发明公开了一种基于随机森林和梯度提升树的预测污水出水指标的方法,其包括以下步骤:步骤1:在原始数据训练集中有放回地抽取样本,构成若干样本集;步骤2:根据样本构建随机森林;根据随机森林计算特征重要性,进行属性筛选;步骤3:根据筛选后的属性形成的样本构建梯度提升树模型;步骤4:根据实时监测数据放入梯度提升树模型中预测出污水厂未来一段时间的污水出水指标。本发明将随机森林与梯度提升树模型结合起来建立了污水出水指标数据的关系模型,通过随机森林的降维和梯度提升树高精度的训练可以较为准确地预测出未来一段时间内的污水出水指标数据。

    一种基于神经网络的K近邻矩阵分解推荐方法

    公开(公告)号:CN112749345A

    公开(公告)日:2021-05-04

    申请号:CN202110176380.4

    申请日:2021-02-09

    Inventor: 项金 高俊波

    Abstract: 本发明公开了一种基于神经网络的K近邻矩阵分解推荐方法,该方法包括:从网站中获取数据集,选取数据集中的若干个用户以及若干个项目,根据若干个用户和若干个项目组成初始矩阵;使用RBF神经网络对初始矩阵的部分空缺值进行预测填充,以降低初始矩阵的稀疏度;对于目标用户使用KNN算法计算在S2步骤中得出的初始矩阵中找到K个最近邻居用户,同理对于目标项目也找到K个最近邻居项目,根据该K个最近邻居用户和K个最近邻居项目构建评分矩阵;对评分矩阵进行矩阵分解,U矩阵代表目标用户的特征,V矩阵代表目标项目的特征,提取新的隐含特征,增加分解的可解释性;将评分矩阵的行列式乘上1/k作为评分标准,给定推荐阈值,判定是否给予推荐。

    基于领域交互信息强度因子分解机的电影点击率预估方法

    公开(公告)号:CN112612920A

    公开(公告)日:2021-04-06

    申请号:CN202011594092.2

    申请日:2020-12-29

    Inventor: 梁子安 高俊波

    Abstract: 本发明公开了一种基于领域交互信息强度因子分解机的电影点击率预估方法,包含:S1、选定数据集作为数据样本,对其进行预处理操作,将预处理后的数据样本划分为训练集和测试集;S2、对训练集的数据进行数据集成,得到低维稠密向量;S3、采用低维稠密向量训练基于领域交互信息强度因子分解机的电影点击率预估模型;S4、采用测试集和评价指标对步骤S3所得的电影点击率预估模型测试进行验证。其优点是:该方法考虑电影相关特征领域作为加权特征,以此综合考量不同域的特征之间的交互强度关系,以便于建模用户兴趣与电影特性间关联性;进一步的,该方法考虑领域之间的交互强度,并对领域间交互强度训练不同权重,以提升电影点击率预估模型的精确度。

    一种基于多特征融合加权的微博文本立场检测方法

    公开(公告)号:CN112214991A

    公开(公告)日:2021-01-12

    申请号:CN202011078456.1

    申请日:2020-10-10

    Abstract: 本发明公开了一种基于多特征融合加权的微博文本立场检测方法,包含:S1、根据指定话题采集相应话题下的所有评论文本,将所有评论文本汇聚于数据集中;S2、对步骤S1中的数据集中的评论文本进行预处理操作;S3、计算步骤S2中所得的每个评论文本的词语的重要性standard(x),提取每个评论文本的特征词;S4、提取每个评论文本中的情感词,将所述情感词与步骤S3中的特征词共同作为原文本,对所述原文本进行词向量映射;S5、将步骤S4所得的数据输入SVM分类器以判断目标文本情感极性倾向。其优点是:该方法通过考虑多个方面的属性特征计算词语的权重,筛选出具有更强意义的特征词,从而提高情感立场倾向检测的准确性,提高对大众舆情事件的响应速度。

    一种基于Lattice LSTM模型的中文电子病历的实体识别方法

    公开(公告)号:CN112151183A

    公开(公告)日:2020-12-29

    申请号:CN202011011399.5

    申请日:2020-09-23

    Inventor: 费若岚 高俊波

    Abstract: 本发明公开了一种基于Lattice LSTM模型的中文电子病历的实体识别方法,包括以下步骤:步骤1:对电子病历数据进行特征向量训练,获得电子病历数据的特征向量;步骤2:基于双向Lattice LSTM编码模型,对所述特征向量进行双向特征向量编码,获得电子病历数据的输出状态序列;步骤3:基于CRF模型的转移特征性,对所述输出状态序列进行标注概率排序,获得实体识别的结果,完成实体识别。此发明解决了传统中文电子病历命名实体识别存在的不足,通过Lattice LSTM模型利用了显性的词信息,使用BERT预训练语言模型融合了字的上下文相关表示,表征字的多义性,引入医学领域的外部词典资源,不仅提升了模型的识别效果,对未登录词也有一定的发现能力。

    一种基于情感衰变因子的抑郁情绪分析方法

    公开(公告)号:CN109977231A

    公开(公告)日:2019-07-05

    申请号:CN201910285499.8

    申请日:2019-04-10

    Abstract: 本发明公开了一种基于情感衰变因子的抑郁情绪分析方法,该方法包括以下步骤:特定人群微博文本采集与标注;微博文本预处理;情感分类器设计;抑郁指数学习模型建立,以抑郁指数表征个体抑郁程度;情感衰变因子的引入,刻画个体抑郁情绪的波动情况。本发明基于情感衰变因子的抑郁情绪分析方法是根据已有的情感词典及网络用语特点,构建专业的抑郁情感词典,更加准确识别抑郁情感特征词,提高识别准确率;本发明还提出引入情感衰变因子的数学模型来计算抑郁情绪值,真实有效地刻画个体抑郁情绪的变化过程,对于抑郁症的预防和治疗有着积极的意义;本发明准确地对个体的抑郁情绪进行了识别与分析。

Patent Agency Ranking