-
公开(公告)号:CN117494786A
公开(公告)日:2024-02-02
申请号:CN202311470867.9
申请日:2023-11-07
Applicant: 北京信息科技大学
IPC: G06N3/09 , G06N3/045 , G06F18/214
Abstract: 本发明提供了一种基于微调的大语言模型热搜生成方法,包括:收集热搜数据,对热搜数据进行预处理;基于预处理后的数据,进行热点事件抽取,得到抽取后的数据;根据抽取后的数据确定模型输入和模型输出,构建训练集和验证集;利用训练集和验证集,对预训练的大语言模型进行调整,得到微调后的大语言模型;将微调后的大语言模型进行应用。通过有监督算法微调大语言模型,使其在生成热搜词条时的准确性提高。进而使其生成的热搜词条更具信息量、吸引力和相关性。
-
公开(公告)号:CN117493995A
公开(公告)日:2024-02-02
申请号:CN202311470818.5
申请日:2023-11-07
Applicant: 北京信息科技大学
IPC: G06F18/2413 , G06F18/2431 , G06F18/24 , G06F18/23211
Abstract: 本发明提供了一种基于新类发现的舆情演化类别动态检测方法及装置,基于语义表示模型的构建与新类的识别,可以实现动态的舆情意见群体划分,进而结合各类中心特点的分析,可以构建舆情动态演化模型,开展舆情演化趋势的分析与舆情治理。本发明通过语义表示模型和舆论聚合操作能够实现舆论类别的动态变换,更加符合舆论演化的实际场景,并且能够为每种意见群体提供直观的描述细节,更为精准的开展舆情把握与治理。
-