-
公开(公告)号:CN119739853A
公开(公告)日:2025-04-01
申请号:CN202411779461.3
申请日:2024-12-05
Applicant: 北京工业大学
IPC: G06F16/34 , G06F16/353 , G06F16/334 , G06F16/338 , G06N5/04 , G06N20/00
Abstract: 本发明提出了一种基于大语言模型自迭代的跨平台社交媒体摘要生成方法,用于对跨平台、多领域的社交媒体数据进行主题聚类与高质量的摘要生成。具体技术方案为:首先从多个社交媒体平台获取多个领域的文本数据,并通过同义词扩展和话题词筛选进行数据预处理。随后,基于文本相似度和LDA模型对数据进行主题聚类,形成多文档数据集。最后,利用生成式大语言模型生成初始摘要,并联合大模型与多维度辅助评估网络在一致性、连贯性、流畅性和主题相关性四个维度上进行评估反馈,进行迭代优化,直至满足多维度质量标准。本方法利用生成式大模型的强大生成能力,能够自动迭代生成高质量摘要,减少人工负担,从而为跨平台社交媒体的高效摘要生成提供了可靠解决方案。
-
公开(公告)号:CN118644316A
公开(公告)日:2024-09-13
申请号:CN202410856543.7
申请日:2024-06-28
Applicant: 北京工业大学
IPC: G06Q30/0601 , G06F16/9535 , G06F16/9536 , G06F18/214 , G06F18/22 , G06F18/23213 , G06N3/0455 , G06N3/084 , G06N3/0985
Abstract: 本发明涉及商品推荐技术领域,提供一种云端协同场景下基于元学习的商品推荐方法及系统,方法包括以下步骤:一、用户发布需购买商品的推荐需求;二、基于用户相似聚类的数据增强:首先利用聚类方法在云端粗粒度的寻找相似用户,之后在终端进行细粒度的数据筛选,选择出合适的数据进行数据增强;三、基于元学习的个性化模型训练:首先在云端进行元模型的训练,再在终端在元模型的基础上进行用户个性化模型的训练;四、基于训练好的用户个性化模型对用户进行个性化商品推荐。本发明能够发挥云端和终端各自的优势,协同合作,能较佳地为用户提供个性化的商品推荐。
-
公开(公告)号:CN117670476A
公开(公告)日:2024-03-08
申请号:CN202311594560.X
申请日:2023-11-27
Applicant: 北京工业大学
IPC: G06Q30/0601 , G06F16/9535
Abstract: 本发明公开了一种面向商品推荐场景的用户个性化模型构建方法,包括:(1)服务器收集所有用户的模型参数,利用K近邻(KNN)算法为每个用户寻找最近邻的K个用户,以实现个性化模型的粗匹配;(2)每个用户根据服务器粗匹配结果,结合自己本地的数据和模型参数进行更细致的匹配,以获得与其特征更加契合的用户模型参数集合。(3)每个用户通过聚合这些细粒度的模型参数来构建个性化子模型,从而有效解决在用户使用本地数据训练模型时由于本地数据量不足导致的模型过拟合问题。本发明不仅解决用户在本地训练个性化模型时所面临的数据量不足问题,而且其总推荐模型准确率超过了传统服务器生成的整体推荐模型在用户群体上的准确率。
-
公开(公告)号:CN117649285A
公开(公告)日:2024-03-05
申请号:CN202311752900.7
申请日:2023-12-19
Applicant: 北京工业大学
IPC: G06Q30/0601 , G06F17/16 , G06F16/9535 , G06F21/62 , G06N3/04 , G06N3/084
Abstract: 本发明公开了一种基于数据隐私分级保护的个性化商品推荐方法。该方法步骤主要包括:(1)用户使用本地数据训练模型,并根据个性化隐私保护需求为不同项目分配不同隐私预算,添加不同的噪声,然后将用户噪声模型上传至推荐服务提供方;(2)推荐服务提供方负责聚合所有用户噪声模型,生成全局噪声模型;(3)用户使用本地训练模型对全局噪声模型进行修正,生成适合用户自身需求的个性化子模型。从本文的理论证明可知,本发明解决了传统差分隐私推荐系统在不破坏差分隐私条件的前提下,无法满足用户个性化隐私保护需求和差分隐私带来的推荐效果下降的问题。通过实验验证,该方法得到的推荐模型总体推荐准确率比现有方法更优。
-
公开(公告)号:CN117633584A
公开(公告)日:2024-03-01
申请号:CN202311529529.8
申请日:2023-11-16
Applicant: 北京工业大学
IPC: G06F18/24 , G06F18/214 , G06F17/16 , G06N3/0464 , G06N3/09
Abstract: 本发明公开了一种用于应用流量分类的自动化深度学习模型生成方法及系统,包含应用流量预处理阶段,应用流量分类模型架构搜索阶段,应用流量分类模型选择阶段。预处理阶段包括:原始应用流量样本重组与IP混淆;获得包字节序列;对包字节序列转换为矢量矩阵。搜索阶段包含:控制器和隐藏状态表初始化;正常与缩减单元结构搜索;链接单元形成分类模型;模型训练与测试;控制器更新;判断是否达到终止条件。选择阶段包括:模型性能排序;本发明使用强化学习方法,减少了设计过程的主观性和人为偏好的影响,可以实现自动生成对应用流量进行分类的深度学习模型,提高了模型的表达能力和分类性能,实现了更高的准确性与效率。
-
公开(公告)号:CN119762322A
公开(公告)日:2025-04-04
申请号:CN202411773306.0
申请日:2024-12-05
Applicant: 北京工业大学
IPC: G06T1/00 , G06F21/16 , G06V10/764 , G06V10/82 , G06N3/0464
Abstract: 本发明提供一种面向生成式模型的基于空域水印的图像数据集版权验证方法。该方法包括受保护数据集生成以及验证模块。受保护数据生成模块包括从原始数据集中选择固定比例样本,对选中样本进行添加水印操作,将原始数据集中未被选中的样本和水印样本集组成受保护的数据集。验证可疑模型是否使用受保护数据集模块包括:对全部样本进行进行添加水印操作,生成水印数据集;对水印数据集进行增强操作,生成增强数据集;使用水印数据集、增强数据集以及原始数据集训练水印分类器;令可疑生成模型随机生成样本;使用分类器判断生成的样本是否带有水印;使用假设检验的方式进行验证,验证上述可疑生成模型是否使用了受保护的数据集。
-
-
-
-
-