-
公开(公告)号:CN111552882A
公开(公告)日:2020-08-18
申请号:CN202010386342.7
申请日:2020-05-09
Applicant: 重庆邮电大学
IPC: G06F16/9535 , G06F16/9536 , G06N3/04 , G06N3/08 , G06Q50/00
Abstract: 本发明属于数据分析领域,为一种新闻影响力计算方法、装置、计算机设备及存储介质;其中方法包括采集历史新闻数据,确定出新闻来源平均阅读数指标和新闻类型热度指标;按照用户行为增长率选择出用户行为趋于稳定的历史新闻数据;确定出与用户行为相关的新闻评论数指标和新闻阅读数指标;对不同的历史新闻数据进行划分出多个事件编号;建立出影响力计算模型;从相同事件编号的历史新闻数据中,按照各指标确定出该历史新闻数据的影响力,并打上等级标签;通过BP神经网络对所述影响力计算模型进行训练;将待计算新闻数据输入到训练后的影响力计算模型中,输出结果。本发明考虑到对新闻影响力更有支持性指标,使得影响力计算模型的准确率更高。
-
公开(公告)号:CN109409496A
公开(公告)日:2019-03-01
申请号:CN201811349939.3
申请日:2018-11-14
Applicant: 重庆邮电大学
IPC: G06N3/00
Abstract: 本发明属于机械故障诊断和分类领域;具体为一种基于蚁群算法改进的LDTW序列相似度量方法,所述方法包括将给定长度的两个序列转换为距离矩阵;将距离矩阵映射成栅格法的0-1矩阵,在0-1矩阵中按照禁忌表对蚂蚁在栅格中的搜索范围进行第一次限制;根据LDTW距离的步长对蚂蚁的搜索范围第二次限制;蚂蚁在第一次和第二次共同限制后的栅格区域移动,根据动态调整状态转移概率移动到下一访问点;从而搜索得到路径;根据蚂蚁搜索得到的栅格值之和,确定适应度函数;适应度函数最小时,为最佳的序列距离长度;根据序列距离长度,确定两个序列的相似度;本发明既保证了弯曲路径长度不超过LDTW限制的弯曲路径长度,又降低计算的时间成本。
-
公开(公告)号:CN111814016B
公开(公告)日:2022-07-12
申请号:CN202010668010.8
申请日:2020-07-13
Applicant: 重庆邮电大学
IPC: G06F16/906 , G06K9/62
Abstract: 本发明属于数据挖掘领域,特别涉及一种混合粒度多视图新闻数据聚类方法,该方法包括:采用TF‑IDF方法对原始的混合粒度多视图新闻数据进行特征选择,得到统一标签粒度的多视图新闻数据;计算该数据的TF‑IDF值,根据TF‑IDF值数据进行映射,得到各个视图的特征向量空间;计算各个视图的信息熵以及各个视图的权重;根据各个视图的权重对特征向量空间中的值进行加权融合,得到各视图的特征矩阵;采用多视图K‑means算法对融合后的特征矩阵进行聚类;本发明通过特征选择对不同粒度进行统一的标签生成处理,使各个视图的特征统一到相同的粒度,同时通过信息熵来反映不同视图对聚类簇结构的贡献程度,从而使聚类后的效果更好。
-
公开(公告)号:CN111552882B
公开(公告)日:2022-07-01
申请号:CN202010386342.7
申请日:2020-05-09
Applicant: 重庆邮电大学
IPC: G06F16/9535 , G06F16/9536 , G06N3/04 , G06N3/08 , G06Q50/00
Abstract: 本发明属于数据分析领域,为一种新闻影响力计算方法、装置、计算机设备及存储介质;其中方法包括采集历史新闻数据,确定出新闻来源平均阅读数指标和新闻类型热度指标;按照用户行为增长率选择出用户行为趋于稳定的历史新闻数据;确定出与用户行为相关的新闻评论数指标和新闻阅读数指标;对不同的历史新闻数据进行划分出多个事件编号;建立出影响力计算模型;从相同事件编号的历史新闻数据中,按照各指标确定出该历史新闻数据的影响力,并打上等级标签;通过BP神经网络对所述影响力计算模型进行训练;将待计算新闻数据输入到训练后的影响力计算模型中,输出结果。本发明考虑到对新闻影响力更有支持性指标,使得影响力计算模型的准确率更高。
-
公开(公告)号:CN111814016A
公开(公告)日:2020-10-23
申请号:CN202010668010.8
申请日:2020-07-13
Applicant: 重庆邮电大学
IPC: G06F16/906 , G06K9/62
Abstract: 本发明属于数据挖掘领域,特别涉及一种混合粒度多视图新闻数据聚类方法,该方法包括:采用TF-IDF方法对原始的混合粒度多视图新闻数据进行特征选择,得到统一标签粒度的多视图新闻数据;计算该数据的TF-IDF值,根据TF-IDF值数据进行映射,得到各个视图的特征向量空间;计算各个视图的信息熵以及各个视图的权重;根据各个视图的权重对特征向量空间中的值进行加权融合,得到各视图的特征矩阵;采用多视图K-means算法对融合后的特征矩阵进行聚类;本发明通过特征选择对不同粒度进行统一的标签生成处理,使各个视图的特征统一到相同的粒度,同时通过信息熵来反映不同视图对聚类簇结构的贡献程度,从而使聚类后的效果更好。
-
-
-
-