-
公开(公告)号:CN119006070A
公开(公告)日:2024-11-22
申请号:CN202411114230.0
申请日:2024-08-14
Applicant: 哈尔滨工业大学
IPC: G06Q30/0282 , G06Q10/063 , G06F18/27
Abstract: 基于评论图片美学的评论有用性的预测方法,属于数据分析技术领域。所述方法是:步骤一:获取目标酒店的在线评论数据;步骤二:对数据筛选和清理,得到数据集;步骤三:确定评论图片美学的评论有用性影响的研究模型,并对模型所需变量进行定义与计算;步骤四:设定被解释变量、解释变量、调节变量和控制变量,构建非线性回归模型,计算得到非线性回归模型的系数和残差项;步骤五:通过将最小二乘回归方法替换为Tobit回归方法和选取子样本集进行稳健性检验,根据步骤四计算得到的非线性回归模型的系数和残差项,得到基于评论图片美学的评论有用性的预测模型。本发明的方法能够对用户评论和酒店信息进行全面高效的、准确率高且易于实现的挖掘和分析。
-
公开(公告)号:CN117114746A
公开(公告)日:2023-11-24
申请号:CN202311074106.1
申请日:2023-08-24
Applicant: 哈尔滨工业大学
IPC: G06Q30/0202 , G06F16/951 , G06F40/289 , G06F40/216
Abstract: 一种突发公共卫生事件对消费者情绪的预测方法,本发明属于数据分析技术领域。方法步骤是:获取数字化平台上的相关数据信息和文本信息,并选定突发公共卫生事件的发生期和发生前期;对获取到的文本信息进行分词处理,并利用文本分析技术获取情感词词频、感知过程词词频和认知过程词词频,并对消费者情绪和影响因素进行表征;将突发公共卫生事件作为自变量,消费者情绪作为因变量,选定其余中介变量和调节变量,将消费者评论时间、出行类型、数字化平台上的评论特征、商家属性特征、评论来源、商品体验时间和评论时间的季节效应作为控制变量,建立计量经济模型;对计量经济模型进行分析。本发明用于突发公共卫生事件对消费者情绪的预测。
-
公开(公告)号:CN115619041B
公开(公告)日:2023-11-21
申请号:CN202211400723.1
申请日:2022-11-09
Applicant: 哈尔滨工业大学
IPC: G06Q10/04 , G06Q30/0601 , G06Q30/0242 , G06F18/23 , G06F40/44 , G06F40/289
-
公开(公告)号:CN119006054A
公开(公告)日:2024-11-22
申请号:CN202411114236.8
申请日:2024-08-14
Applicant: 哈尔滨工业大学
IPC: G06Q30/0241 , G06Q30/0242 , G06F16/951 , G06F18/27
Abstract: 一种带货视频时长对产品销量的预测方法,属于数据分析技术领域。该方法包括以下步骤:步骤一:获取带货短视频的销售数据、博主数据、产品数据;步骤二:对数据预处理;步骤三:对研究模型所需的变量进行定义,计算模型所需变量;步骤四:设置被解释变量、解释变量、调节变量和控制变量,并引入视频实际时长的二次项,构建计量模型且固定产品类别效应,通过计量分析方法与倒U型关系检验三步法计算计量经济模型的系数和残差项;步骤五:稳健性检验;引入三次项、调整样本;未通过则返回步骤四;若通过,则说明通过了稳健性检验,执行步骤六,异质性检验;探究产品价格与产品类别对二者倒U型关系的影响。本发明用于带货视频时长对产品销量的预测。
-
公开(公告)号:CN117114746B
公开(公告)日:2024-07-16
申请号:CN202311074106.1
申请日:2023-08-24
Applicant: 哈尔滨工业大学
IPC: G06Q30/0202 , G06F16/951 , G06F40/289 , G06F40/216
Abstract: 一种突发公共卫生事件对消费者情绪的预测方法,本发明属于数据分析技术领域。方法步骤是:获取数字化平台上的相关数据信息和文本信息,并选定突发公共卫生事件的发生期和发生前期;对获取到的文本信息进行分词处理,并利用文本分析技术获取情感词词频、感知过程词词频和认知过程词词频,并对消费者情绪和影响因素进行表征;将突发公共卫生事件作为自变量,消费者情绪作为因变量,选定其余中介变量和调节变量,将消费者评论时间、出行类型、数字化平台上的评论特征、商家属性特征、评论来源、商品体验时间和评论时间的季节效应作为控制变量,建立计量经济模型;对计量经济模型进行分析。本发明用于突发公共卫生事件对消费者情绪的预测。
-
公开(公告)号:CN117094855B
公开(公告)日:2024-06-25
申请号:CN202311074098.0
申请日:2023-08-24
Applicant: 哈尔滨工业大学
IPC: G06Q50/12 , G06Q10/0639 , G06F18/10 , G06F16/951 , G06F16/9535 , G06F18/25
Abstract: 基于酒店服务语言的非本土语言顾客满意度的预测方法,本发明属于数据分析技术领域。方法是:获取目标酒店的基本数据、评论数据以及顾客数据,得到原始数据集;对原始数据集进行数据预处理;对研究模型所需的变量进行定义,并利用清洗后的数据集对所需的变量进行测算;分别设置被解释、解释、调节和控制变量,构建基于固定效应的计量模型,计算得到固定效应模型的系数和残差项;对非本土语言顾客满意度的预测模型进行稳健性检验;若预测模型通过了稳健性检验,则将固定效应模型的系数和残差项带入模型,即得到基于酒店服务语言的非本土语言顾客满意度的预测模型;若未通过,则需对预测模型进行再次构建与分析。本发明用于酒店顾客满意度预测。
-
公开(公告)号:CN116127074B
公开(公告)日:2024-03-01
申请号:CN202310157141.3
申请日:2023-02-23
Applicant: 哈尔滨工业大学
IPC: G06F16/35 , G06F40/242 , G06F40/279 , G06F40/30 , G06F18/23213 , G06F18/24
Abstract: 基于LDA主题模型和kmeans聚类算法的主播画像分类方法,属于数据分析技术领域。步骤:S1、在指示终端设备中获取主播信息,得到原始数据集,并对获取的主播信息进行数据预处理,得到初始数据集;S2、根据初始数据集,构建LDA主题模型,从初始数据集中挖掘出主题词和每位主播文本信息的主题概率分布;S3、数据转换,将每位主播的数据信息进行对数处理和标准化;S4、确定聚类的类别数量,依据轮廓系数和簇内误差平方和确定聚类的类别数量;S5、依据kmeans聚类算法主播相关数值数据进行聚类,得到主播所属的不同类别,并依据结果分析主播特质,建立主播画像。本发明可将主播的文本数据与结构化数据同时进行聚类,建立主播画像,精细化营销。
-
公开(公告)号:CN116127074A
公开(公告)日:2023-05-16
申请号:CN202310157141.3
申请日:2023-02-23
Applicant: 哈尔滨工业大学
IPC: G06F16/35 , G06F40/242 , G06F40/279 , G06F40/30 , G06F18/23213 , G06F18/24
Abstract: 基于LDA主题模型和kmeans聚类算法的主播画像分类方法,属于数据分析技术领域。步骤:S1、在指示终端设备中获取主播信息,得到原始数据集,并对获取的主播信息进行数据预处理,得到初始数据集;S2、根据初始数据集,构建LDA主题模型,从初始数据集中挖掘出主题词和每位主播文本信息的主题概率分布;S3、数据转换,将每位主播的数据信息进行对数处理和标准化;S4、确定聚类的类别数量,依据轮廓系数和簇内误差平方和确定聚类的类别数量;S5、依据kmeans聚类算法主播相关数值数据进行聚类,得到主播所属的不同类别,并依据结果分析主播特质,建立主播画像。本发明可将主播的文本数据与结构化数据同时进行聚类,建立主播画像,精细化营销。
-
公开(公告)号:CN115630644A
公开(公告)日:2023-01-20
申请号:CN202211400727.X
申请日:2022-11-09
Applicant: 哈尔滨工业大学
IPC: G06F40/289 , G06F40/44 , G06F18/241
Abstract: 基于LDA主题模型的直播用户弹幕的话题挖掘方法,涉及数据分析技术领域。本发明利用LDA主题模型挖掘直播用户弹幕互动的不同主题分布,包括以下步骤:S1、获取每场直播的弹幕信息,得到原始数据集;S2、对原始数据集中的弹幕文本进行数据预处理,得到初始数据集;S3、根据初始数据集,构建LDA主题模型;S4、通过LDA主题模型从初始数据集中挖掘出主题高频词和每场直播的主题分布,确定主题数,归纳互动内容。本发明的方法可以广泛运用在各种直播弹幕中,了解观众的互动内容与用户兴趣。
-
公开(公告)号:CN117094856B
公开(公告)日:2024-04-30
申请号:CN202311074103.8
申请日:2023-08-24
Applicant: 哈尔滨工业大学
IPC: G06Q50/12 , G06F16/951 , G06F18/10 , G06F17/18 , G06N20/00
Abstract: 基于面板logit模型的嵌入OTA网站后用户评价行为的预测方法,属于数据分析技术领域。步骤一:获取原始数据集;步骤二:对原始数据集进行数据预处理,得到清洗后的数据集;步骤三:对顾客评价行为相关的文献和理论进行梳理,确定嵌入OTA网站的评论特征对原OTA网站上后续评论行为的影响的研究模型,对研究模型所需的变量进行定义,并利用清洗后的数据集对所需的变量进行计算;步骤四:构建logit模型,得到面板logit模型的系数和残差项;步骤五:稳健性检验;若面板logit模型通过稳健性检验,则说明模型具有可靠性,将系数和残差项带回面板logit模型即得到预测模型;若否,则需对面板logit模型进行再次构建与分析,即返回执行步骤四。本发明的方法用于用户评价行为的预测。
-
-
-
-
-
-
-
-
-