-
公开(公告)号:CN116483990A
公开(公告)日:2023-07-25
申请号:CN202310448620.0
申请日:2023-04-24
Applicant: 重庆邮电大学
IPC: G06F16/34 , G06F16/35 , G06F40/186 , G06F40/211 , G06F40/226
Abstract: 本发明属于文本生成领域,具体涉及一种基于大数据的互联网新闻内容自动生成方法,包括:获取新闻文本数据;对新闻文本数据进行清洗;将清洗后的新闻文本数据划分为无标签文本和有标签文本;将无标签文本数据输入到基于Transformer的大规模模型中进行预训练,将有标签文本输入到训练好的大规模模型中进行参数微调处理,得到完善的新闻文本内容生成模型;获取新闻关键词,将新闻关键词输入到新闻文本内容生成模型中,并采用动态规划的文本生成搜索策略得到生成的新闻播报内容;本发明采用三种针对挖掘新闻关键词与文本原文之间关系的预训练任务,解决了新闻文本生成从简单关键词中提取有效信息并扩写复杂且完整的新闻内容的困难。
-
公开(公告)号:CN116647374A
公开(公告)日:2023-08-25
申请号:CN202310580044.5
申请日:2023-05-23
Applicant: 重庆邮电大学
IPC: H04L9/40 , G06N3/0442 , G06N3/084
Abstract: 本发明属于网络信息安全领域,具体涉及一种基于大数据的网络流量入侵检测方法,包括:获取带标签的网络流量数据,平衡获取的网络流量数据;对数据平衡后的网络流量数据进行离散化处理得到特征向量,并进行特征分解,得到离散化特征分解向量;将网络流量数据建立图结构,并融入离散化特征分解向量,对该图进行卷积操作,提取图结构中的关系信息;根据图结构的关系信息和标签信息对Bi‑LSTM模型进行训练;使用训练完成后的模型进行网络流量数据进行分类,判断其是否为正常流量还是网络入侵。本发明通过网络流量密度的少数类过采样克服数据不平衡问题,采用大数据多尺度频带特征提取法来进行特征提取,提高了模型的检测精度和泛化能力。
-