一种基于大数据的互联网假新闻识别方法

    公开(公告)号:CN117034905B

    公开(公告)日:2024-05-14

    申请号:CN202310985688.2

    申请日:2023-08-07

    Abstract: 本发明涉及自然语言处理技术领域,具体涉及一种基于大数据的互联网假新闻识别方法,包括:获取互联网新闻数据并进行预处理得到新闻文本数据集;采用贪婪策略对新闻文本数据集进行重复事件检测得到多个原始事件图;为每一个原始事件图设置相应的节点特征、边特征和簇特征,得到初始事件图;构造Motif特征提取器,并采用初始事件图进行训练;根据训练好的Motif特征提取器构建图模型,并采用初始事件图进行训练;将待识别互联网新闻输入训练好的图模型,输出待识别互联网新闻的真假判别结果;本发明对虚假信息进行早期检测并及时阻断其传播,极大降低虚假新闻带来的危害,营造清朗的网络舆论空间。

    一种基于大模型的试题解答分析系统

    公开(公告)号:CN119938837A

    公开(公告)日:2025-05-06

    申请号:CN202510000733.3

    申请日:2025-01-02

    Abstract: 本发明涉及大模型技术领域,具体涉及一种基于大模型的试题解答分析系统,包括试题采集模块,用于接收用户输入的目标试题;匹配模块,用于通过路由模型识别目标试题所属的科目类型,并分配对应的检索模型;知识库模块,用于存储不同科目类型的试题数据;辅助检索模块,用于通过检索模型获取目标试题的嵌入式表达,根据嵌入式表达采用召回方法从知识库中提取辅助数据;试题解析模块,用于通过将目标试题、辅助数据输入试题解析模型,得到目标试题分析结果;显示模块,用于显示目标试题分析结果;本发明能够为用户提供高质量的学习支持。

    一种基于大数据的系统访问风险识别方法

    公开(公告)号:CN116644420B

    公开(公告)日:2023-11-17

    申请号:CN202310685878.2

    申请日:2023-06-09

    Inventor: 唐鑫 王进 王一雄

    Abstract: 本发明涉及大数据处理技术和用户系统访问风险检测技术领域,特别涉及一种基于大数据的系统访问风险识别方法;包括获取用户的历史系统访问日志数据,并对其缺失的用户名进行融合哈希用户名重建预处理,得到预处理数据;提取预处理数据的指数式极角极径日历特征和网格化地理交叉特征,将这两种特征组成一条训练数据;通过LXT模型重要性对数函数加权平均融合法对训练数据进行特征选择,将选择的特征输入加权对数损失支持向量机;通过标准SVM优化模型预测该用户的系统访问是否存在风险。

    一种基于大数据的系统访问风险识别方法

    公开(公告)号:CN116644420A

    公开(公告)日:2023-08-25

    申请号:CN202310685878.2

    申请日:2023-06-09

    Inventor: 唐鑫 王进 王一雄

    Abstract: 本发明涉及大数据处理技术和用户系统访问风险检测技术领域,特别涉及一种基于大数据的系统访问风险识别方法;包括获取用户的历史系统访问日志数据,并对其缺失的用户名进行融合哈希用户名重建预处理,得到预处理数据;提取预处理数据的指数式极角极径日历特征和网格化地理交叉特征,将这两种特征组成一条训练数据;通过LXT模型重要性对数函数加权平均融合法对训练数据进行特征选择,将选择的特征输入加权对数损失支持向量机;通过标准SVM优化模型预测该用户的系统访问是否存在风险。

    一种基于大数据的广告高价值用户识别方法

    公开(公告)号:CN118014660A

    公开(公告)日:2024-05-10

    申请号:CN202410026232.8

    申请日:2024-01-08

    Abstract: 本发明涉及大数据领域,具体涉及一种基于大数据的广告高价值用户识别方法,包括获取广告信息数据集、用户信息数据集和流水数据集;对流水数据集进行划分得到多组用户流水样本,对每一组用户流水样本进行预处理得到对应的训练样本,构建广告高价值用户识别模型,采用训练样本集合训练广告高价值用户识别模型;并通过双阈值对比损失和偏权重交叉熵损失对广告高价值用户识别模型进行参数优化,直到模型收敛;获取待识别用户数据输入训练好的广告高价值用户识别模型,得到用户价值识别结果;本发明提升识别准确度。

    一种基于大数据的互联网假新闻识别方法

    公开(公告)号:CN117034905A

    公开(公告)日:2023-11-10

    申请号:CN202310985688.2

    申请日:2023-08-07

    Abstract: 本发明涉及自然语言处理技术领域,具体涉及一种基于大数据的互联网假新闻识别方法,包括:获取互联网新闻数据并进行预处理得到新闻文本数据集;采用贪婪策略对新闻文本数据集进行重复事件检测得到多个原始事件图;为每一个原始事件图设置相应的节点特征、边特征和簇特征,得到初始事件图;构造Motif特征提取器,并采用初始事件图进行训练;根据训练好的Motif特征提取器构建图模型,并采用初始事件图进行训练;将待识别互联网新闻输入训练好的图模型,输出待识别互联网新闻的真假判别结果;本发明对虚假信息进行早期检测并及时阻断其传播,极大降低虚假新闻带来的危害,营造清朗的网络舆论空间。

Patent Agency Ranking