-
公开(公告)号:CN119358675A
公开(公告)日:2025-01-24
申请号:CN202411411504.2
申请日:2024-10-10
Applicant: 北京市新技术应用研究所有限公司
IPC: G06N5/04 , G06N5/022 , G06F40/295 , G06V20/40
Abstract: 本发明公开了一种生成旅游类短视频描述的方法及系统。该方法包括如下步骤:S 1:采集用户生成内容的网页信息,用户生成内容的网页信息包括旅游景点图片和相关文字;S2:采集短视频,抽取短视频中的图像帧;S3:利用知识图谱,为步骤S 1和步骤S2采集到的图片和图像帧生成图文对;S4:生成并训练大语言模型;S5:利用步骤S4中训练好的大语言模型,根据步骤S3中生成的图文对,生成短视频的文本描述。利用本发明,能够有效提升旅游类短视频内容的可检索性和可理解性。
-
公开(公告)号:CN118916490A
公开(公告)日:2024-11-08
申请号:CN202411002529.7
申请日:2024-07-25
Applicant: 北京市新技术应用研究所有限公司
IPC: G06F16/35 , G06F16/36 , G06N3/0455 , G06N3/08 , G06F40/295 , G06F40/284 , G06N5/022 , G06F40/117
Abstract: 一种基于主题预分类和知识图谱的多维文本分类方法,借助中间信息“文本主题”进行分类的方法,基于主题预分类和知识图谱进行多维文本分类,针对不同的主题,构建相应的分析模式,根据模式提取关键词,附加到文本向量中,由BERT网络训练出合适模型;使用时,对输入热线文本进行文本分词,结合查询知识图谱,由所述BERT网络训练好的模型进行匹配,对热线文本进行及时有效地准确分类处理,向社会职能管理部门进行准确地精细化分配,实现了对热线文本的多维准确分类。
-