-
公开(公告)号:CN116127074B
公开(公告)日:2024-03-01
申请号:CN202310157141.3
申请日:2023-02-23
Applicant: 哈尔滨工业大学
IPC: G06F16/35 , G06F40/242 , G06F40/279 , G06F40/30 , G06F18/23213 , G06F18/24
Abstract: 基于LDA主题模型和kmeans聚类算法的主播画像分类方法,属于数据分析技术领域。步骤:S1、在指示终端设备中获取主播信息,得到原始数据集,并对获取的主播信息进行数据预处理,得到初始数据集;S2、根据初始数据集,构建LDA主题模型,从初始数据集中挖掘出主题词和每位主播文本信息的主题概率分布;S3、数据转换,将每位主播的数据信息进行对数处理和标准化;S4、确定聚类的类别数量,依据轮廓系数和簇内误差平方和确定聚类的类别数量;S5、依据kmeans聚类算法主播相关数值数据进行聚类,得到主播所属的不同类别,并依据结果分析主播特质,建立主播画像。本发明可将主播的文本数据与结构化数据同时进行聚类,建立主播画像,精细化营销。
-
公开(公告)号:CN115619041B
公开(公告)日:2023-11-21
申请号:CN202211400723.1
申请日:2022-11-09
Applicant: 哈尔滨工业大学
IPC: G06Q10/04 , G06Q30/0601 , G06Q30/0242 , G06F18/23 , G06F40/44 , G06F40/289
-
公开(公告)号:CN116303893B
公开(公告)日:2024-01-30
申请号:CN202310161332.7
申请日:2023-02-23
Applicant: 哈尔滨工业大学
IPC: G06F16/33 , G06F16/335 , G06F16/35 , G06F40/279 , G06F40/30
Abstract: 基于LDA主题模型的主播形象分类与关键特质分析方法,属于数据分析技术领域。方法是:S1、在指示终端设备中获取每位主播的介绍文本,得到原始数据集;S2、对原始数据集中的介绍文本进行数据预处理,得到初始数据集;S3、根据初始数据集,构建LDA主题模型;S4、通过LDA主题模型从初始数据集中挖掘出主题高频词和每位主播自我介绍的主题分布,确定主题数,依据主题分布的最高值作为该主播形象分类;S5、使用方差分析,得到不同主播群体之间的差异性特质,了解不同主播群体的直播效果差异;S6、基于不同主播群体之间的差异性特质和直播效果差异,使用回归分析,得到每个主播群体内的影响直播效果的关键特质。本发明用于主播形象分类
-
公开(公告)号:CN116303893A
公开(公告)日:2023-06-23
申请号:CN202310161332.7
申请日:2023-02-23
Applicant: 哈尔滨工业大学
IPC: G06F16/33 , G06F16/335 , G06F16/35 , G06F40/279 , G06F40/30
Abstract: 基于LDA主题模型的主播形象分类与关键特质分析方法,属于数据分析技术领域。方法是:S1、在指示终端设备中获取每位主播的介绍文本,得到原始数据集;S2、对原始数据集中的介绍文本进行数据预处理,得到初始数据集;S3、根据初始数据集,构建LDA主题模型;S4、通过LDA主题模型从初始数据集中挖掘出主题高频词和每位主播自我介绍的主题分布,确定主题数,依据主题分布的最高值作为该主播形象分类;S5、使用方差分析,得到不同主播群体之间的差异性特质,了解不同主播群体的直播效果差异;S6、基于不同主播群体之间的差异性特质和直播效果差异,使用回归分析,得到每个主播群体内的影响直播效果的关键特质。本发明用于主播形象分类与关键特质分析。
-
公开(公告)号:CN115619041A
公开(公告)日:2023-01-17
申请号:CN202211400723.1
申请日:2022-11-09
Applicant: 哈尔滨工业大学
IPC: G06Q10/04 , G06Q30/0601 , G06Q30/0242 , G06F18/23 , G06F40/44 , G06F40/289
Abstract: 基于LDA主题模型与固定效应模型的直播效果的预测方法,属于数据分析技术领域。方法是:获取主播和每场直播的信息,得到原始数据集;对原始数据集中的弹幕文本进行数据预处理,得到初始数据集;根据初始数据集,构建LDA主题模型,并通过LDA主题模型从初始数据集中挖掘出主题词和每场直播的主题概率分布;依据每场直播互动模式的概率分布及其二次项,并分别加入直播时长、粉丝数量、该场直播的访问量及直播效果构建固定效应模型,从而探究多个自变量对直播效果的影响关系,并得到固定效应模型系数和残差项;根据二次项固定效应模型系数,探求该主播群体固定效应模型的极值点,探究针对直播的最佳互动模式。本发明用于直播效果的预测、分析与提升。
-
公开(公告)号:CN116127074A
公开(公告)日:2023-05-16
申请号:CN202310157141.3
申请日:2023-02-23
Applicant: 哈尔滨工业大学
IPC: G06F16/35 , G06F40/242 , G06F40/279 , G06F40/30 , G06F18/23213 , G06F18/24
Abstract: 基于LDA主题模型和kmeans聚类算法的主播画像分类方法,属于数据分析技术领域。步骤:S1、在指示终端设备中获取主播信息,得到原始数据集,并对获取的主播信息进行数据预处理,得到初始数据集;S2、根据初始数据集,构建LDA主题模型,从初始数据集中挖掘出主题词和每位主播文本信息的主题概率分布;S3、数据转换,将每位主播的数据信息进行对数处理和标准化;S4、确定聚类的类别数量,依据轮廓系数和簇内误差平方和确定聚类的类别数量;S5、依据kmeans聚类算法主播相关数值数据进行聚类,得到主播所属的不同类别,并依据结果分析主播特质,建立主播画像。本发明可将主播的文本数据与结构化数据同时进行聚类,建立主播画像,精细化营销。
-
公开(公告)号:CN115630644A
公开(公告)日:2023-01-20
申请号:CN202211400727.X
申请日:2022-11-09
Applicant: 哈尔滨工业大学
IPC: G06F40/289 , G06F40/44 , G06F18/241
Abstract: 基于LDA主题模型的直播用户弹幕的话题挖掘方法,涉及数据分析技术领域。本发明利用LDA主题模型挖掘直播用户弹幕互动的不同主题分布,包括以下步骤:S1、获取每场直播的弹幕信息,得到原始数据集;S2、对原始数据集中的弹幕文本进行数据预处理,得到初始数据集;S3、根据初始数据集,构建LDA主题模型;S4、通过LDA主题模型从初始数据集中挖掘出主题高频词和每场直播的主题分布,确定主题数,归纳互动内容。本发明的方法可以广泛运用在各种直播弹幕中,了解观众的互动内容与用户兴趣。
-
-
-
-
-
-