-
公开(公告)号:CN117372930A
公开(公告)日:2024-01-09
申请号:CN202311379146.7
申请日:2023-10-24
Applicant: 重庆邮电大学
IPC: G06V20/40 , G06F16/75 , G06V10/80 , G06V10/776
Abstract: 本发明涉及自然语言处理领域,具体涉及一种基于多模态大数据的短视频舆情分类方法,该方法包括:获取待处理的短视频数据和对应的标题数据;对标题数据进行预处理,得到标题向量特征;从短视频数据中抽取K帧图片,将K帧图片输入到多个patch输入视频编码模块中,得到视频向量特征;根据标题向量特征和视频向量特征计算数据特征向量;对数据特征向量添加高斯噪声,并输入到分类器,得到分类结果;本发明能够充分融合短视频舆情数据中的视频向量特征和文本向量特征得到数据向量特征,同时向数据向量特征中引入高斯噪声以增强模型的泛化性能。
-
公开(公告)号:CN115935994A
公开(公告)日:2023-04-07
申请号:CN202211589747.6
申请日:2022-12-12
Applicant: 重庆邮电大学
IPC: G06F40/295 , G06F18/214
Abstract: 本发明属于自然语言处理的命名实体识别领域,特别涉及一种智能识别电商标题方法,所述方法包括:收集电商数据样本,对数据进行标注;送入自注意力模型,得到词向量;使用掩码自注意力机制分别提取正向信息和反向信息;头指针与尾指针匹配时融入相对位置向量信息,得到预测的实体片段,本发明引入辅助学习任务,让实体边界更加清晰;采用掩码自注意力机制表达正向和反向的信息,保证前后信息不会被泄露;头指针与尾指针匹配融入相对位置向量,提升相邻位置的语义表达。
-
公开(公告)号:CN115758223A
公开(公告)日:2023-03-07
申请号:CN202211545535.8
申请日:2022-12-05
Applicant: 重庆邮电大学
IPC: G06F18/24
Abstract: 本发明属于自然语言处理技术领域,具体涉及一种智能数据噪声筛选方法,包括:获取多标记数据,构建真实标记矩阵和含噪标记矩阵;通过真实标记矩阵和含噪标记矩阵构建噪声筛选模型;训练模型,并控制模型复杂度;对模型进行优化,并求解模型的参数,并更新参数得到最优参数,固定最优参数得到最优的噪声筛选模型;将待筛选数据输入最优的噪声筛选模型,得到真实标记数据。本发明利用含噪标记矩阵构建一个多标记分类器和噪声标记检测器,一方面减少冗余标记噪声对模型准确率的负面影响并生成具有区分性的特征信息,另一方面通过减少标记维度来提高模型的训练和预测效率,训练后的偏多标记学习模型对特征噪声和冗余标记噪声都具有更强的鲁棒性。
-
公开(公告)号:CN117407527A
公开(公告)日:2024-01-16
申请号:CN202311357715.8
申请日:2023-10-19
Applicant: 重庆邮电大学
IPC: G06F16/35 , G06N3/0442 , G06F40/30
Abstract: 本发明属于自然语言处理技术领域,具体涉及一种教育领域舆情大数据分类方法;包括:获取教育领域舆情文本并对其进行舆情类别和情感类别标注,得到教育领域舆情数据集;采用继续预训练的编码模型对教育领域舆情数据集进行编码,得到舆情文本向量;从舆情文本向量中提取舆情文本特征向量;对舆情文本特征向量和舆情文本向量进行处理,得到舆情类别第一概率矩阵和情感类别第一概率矩阵;构建提示模板和选择题模板并采用多任务学习得到舆情类别第二概率矩阵和情感类别第二概率矩阵;融合舆情类别第一概率矩阵和第二概率矩阵得到舆情分类结果,融合情感类别第一概率矩阵和第二概率矩阵得到情感分类结果;本发明可提高分类精确度,有助于舆情控制。
-
公开(公告)号:CN116541523A
公开(公告)日:2023-08-04
申请号:CN202310485333.7
申请日:2023-04-28
Applicant: 重庆邮电大学
IPC: G06F16/35 , G06F40/30 , G06F40/284 , G06F40/247
Abstract: 本发明属于自然语言处理领域,具体涉及一种基于大数据的法律判决舆情分类方法;该方法包括:获取法律判决文本数据和带标签的舆情文本数据;提取舆情文本的词级特征向量和句级特征向量;提取法律判决文本的词级特征向量;根据舆情文本的词级特征向量和法律判决文本的词级特征向量得到舆情文本的交叉词级特征向量;对舆情文本的句级特征向量作聚类处理,得到正向舆情聚类中心和非正向舆情聚类中心;根据交叉词级特征进行分类,得到舆情文本的分类结果;计算模型总损失;根据总损失调整模型参数,得到训练好的文本分类模型;本发明提高了模型的分类准确度。
-
-
-
-