-
公开(公告)号:CN119622517A
公开(公告)日:2025-03-14
申请号:CN202411720829.9
申请日:2024-11-28
Applicant: 南京信息工程大学
IPC: G06F18/2415 , G06F18/10
Abstract: 本发明公开了基于用户生成内容的识别小众主题动态演化方法及系统,涉及文本挖掘技术领域,包括:接收用户生成内容数据,对用户生成内容数据进行预处理,得到预处理后的用户生成内容数据,获取时间数据,将预处理后的用户生成内容数据与时间数据进行整合,得到整合数据;利用吉布斯抽样方法对预先建立的分层贝叶斯模型的模型参数进行更新优化,得到优化后的分层贝叶斯模型,其中,所述预先建立的分层贝叶斯模型基于整合数据生成;对优化后的分层贝叶斯模型进行求解,输出得到用户小众主题含义结果,对用户小众主题含义结果进行动态演化计算,得出小众主题动态演化结果。
-
公开(公告)号:CN116340498A
公开(公告)日:2023-06-27
申请号:CN202310127387.6
申请日:2023-02-17
Applicant: 南京信息工程大学
IPC: G06F16/335 , G06F16/33 , G06Q30/0601
Abstract: 本发明公开了信息检索领域的一种基于用户文本生成内容的小众偏好学习方法,包括以下步骤:对于获取到的用户文本生成内容进行数据预处理操作;将预处理得到的数据建立一个分层贝叶斯模型,得到联合分布模型;通过吉布斯抽样方法学习模型参数,得到大众偏好分布和小众偏好分布公式;利用学习到的模型参数,分析基于用户文本生成内容的用户小众偏好的含义;利用用户小众偏好分布寻找小众偏好下的目标用户。本发明方法从用户偏好的角度,区分了大众偏好和小众偏好,利用分层贝叶斯方法良好的可解释性,识别用户小众偏好的具体含义,为中小企业提供了进入合适小众市场的机会,同时每个用户的小众偏好分布有益于企业找出相关小众市场的目标用户。
-
公开(公告)号:CN115329038A
公开(公告)日:2022-11-11
申请号:CN202210917286.4
申请日:2022-08-01
Applicant: 南京信息工程大学
IPC: G06F16/33 , G06F16/338 , G06F40/216 , G06F40/30
Abstract: 本发明涉及信息检索技术领域,具体是一种融合主题模型的图书馆平台语义检索方法,包括对所有被检索的文档进行数据预处理,得到合格的被检索文档;利用布尔模型将用户的检索词语与合格的被检索文档进行匹配,根据匹配结果将文档分类并赋予不同的权重值;利用主题模型对合格的被检索文档进行计算,得到每个文档的主题分布和主题单词的分布;将主题单词的频数分布转换为单词主题分布;计算检索词的单词主题分布与被检索文档的之间的相似性分数;利用文档权重与相似性分数计算检索词与各个被检索文档的联系分数,并根据联系分数进行排序后将查询结果返回给用户。本发明可以大大提高图书馆平台语义检索效率,有效满足用户检索知识服务的需求。
-
-