-
-
公开(公告)号:CN104036051A
公开(公告)日:2014-09-10
申请号:CN201410317326.7
申请日:2014-07-04
Applicant: 南开大学
IPC: G06F17/30
CPC classification number: G06F17/30292
Abstract: 本发明公布了一种基于标签传播的数据库模式摘要生成方法,属于数据库技术应用领域。本发明方法的基本步骤如下:首先采用数据库模式到标签图的映射方法,通过关系表中的主外键信息、属性信息以及元组信息衡量每张关系表的重要性。其次采用多元线性回归模型计算关系表的相似性,选取名称、属性值以及关系表之间的映射关系作为相似度模型的主要特征。最后采用半监督的标签传播算法对模式信息聚类,自动生成模式摘要。本发明提出的数据库模式摘要生成方法,能够为大规模数据库模式摘要的自动生成提供一种有效的解决方案,达到帮助用户快速理解数据库模式信息的目的。
-
公开(公告)号:CN119539450B
公开(公告)日:2025-05-02
申请号:CN202510104793.X
申请日:2025-01-23
Applicant: 南开大学
IPC: G06Q10/0631 , G06Q50/14 , G06F18/23213 , G06F40/20
Abstract: 本发明涉及数据挖掘技术领域,提供基于自然语言的行程规划方法、系统、设备、产品及介质,包括:构建兴趣点数据集;获取用户输入文本和双层大语言模型,对用户输入文本进行解析和微调得到用户需求参数;通过兴趣点数据集对兴趣点进行聚类,得到初始候选列表,计算余弦相似度,以计算候选列表中兴趣点的兴趣点得分,对初始候选列表进行排序,得到中间候选列表;反转交换得到反转候选列表,计算每个反转候选列表的局部最优评分,并进行跨聚类替换,得到目标候选列表;生成目标候选列表,并计算综合行程评分,将综合行程评分最高的目标候选列表作为行程列表,并通过行程列表得到行程规划。本发明有效提高了行程规划的用户体验。
-
公开(公告)号:CN119149807A
公开(公告)日:2024-12-17
申请号:CN202411076682.4
申请日:2024-08-07
Applicant: 南开大学 , 嗯噢哇网络科技有限公司
IPC: G06F16/9535 , G06F16/9537 , G06F18/214 , G06F18/23 , G06F18/25
Abstract: 本发明涉及数据挖掘技术领域,提供一种空间相关兴趣点推荐方法、系统、设备、产品及介质。该方法包括:构建位置向量预训练网络,使用位置向量预训练网络训练位置向量;利用位置向量预训练网络生成描述兴趣点位置信息的位置向量,构建轨迹编码网络并融合位置向量,将每个用户的签到数据转化成轨迹切片向量,生成用户的兴趣点偏好得分;联合用户访问目标和空间关联目标集合的多目标学习函数,利用兴趣点偏好得分生成损失来实现轨迹编码网络的训练。本发明从用户签到数据的地理特征表示和地理关联目标学习这两个角度实现兴趣点推荐的需求,有效地捕捉了用户移动行为中的空间聚类模式,提高了兴趣点推荐效果。
-
公开(公告)号:CN118196548B
公开(公告)日:2024-08-23
申请号:CN202410034242.6
申请日:2024-01-10
Applicant: 南开大学 , 中国科学院自动化研究所
IPC: G06V10/774 , G06V10/764 , G06V10/82 , G06N3/084 , G06N3/0895 , G06N3/0464
Abstract: 本发明涉及图像识别技术领域,尤其涉及基于双重空间对比学习的开放世界半监督图像分类方法,包括如下步骤:初始化网络模型;构建特征图及预测图;进行双重空间对比迭代学习训练,计算监督损失、特征空间自监督对比损失、预测空间自监督对比损失、特征空间与预测空间之间的空间引导对比损失及总体损失,根据总体损失对网络模型进行梯度反向传播及网络模型参数更新;重复迭代得到训练好的网络模型;对无标签数据集中的每一个无标签样本进行推理,得出每一个无标签样本预测的标记结果。本发明提供的方法提升了网络模型对于无标签数据的表征能力,从而提升对于无标签数据的标记准确率。
-
公开(公告)号:CN113887836B
公开(公告)日:2024-04-19
申请号:CN202111297889.0
申请日:2021-11-04
Applicant: 南开大学
IPC: G06F18/25 , G06N3/0455 , G06F40/211
Abstract: 本发明属于人工智能技术领域,特别是一种融合事件环境信息的叙事性事件预测方法。包括:首先通过叙事性事件与非结构文本之间的内在关系,获得与叙事性事件直接相关的环境描述;其次,通过多头注意力机制利用事件的语义信息从环境描述中抽取出局部与全局的事件环境特征;再次,通过事件预测模型编码模块将叙事性事件特征与环境特征互相编码得到融合事件环境的事件演化特征;最后,叙事性事件预测解码模块根据演化特征,从候选项中选择出正确的下一叙事性事件,完成事件预测任务。本发明能够解决叙事性事件预测任务中对事件环境信息利用不充分的问题,事件环境信息能够为叙事性事件提供更加完善的上下文信息,提高事件预测模型对事件演化的理解水平。
-
公开(公告)号:CN117539918A
公开(公告)日:2024-02-09
申请号:CN202311490838.9
申请日:2023-11-10
Applicant: 南开大学 , 中国电子科技集团公司第五十四研究所
IPC: G06F16/2457 , G06F18/2411 , G06F18/15
Abstract: 本发明涉及数据处理技术领域,公开了一种用户异常行为分析方法及系统,用于提高用户异常行为分析的准确率。方法包括:从预置的数据库中采集用户历史行为数据,并对所述用户历史行为数据进行编码映射,得到行为编码集合;对所述行为编码集合进行用户意图向量转换,得到用户行为意图向量集合;对所述用户行为意图向量集合进行数据增强处理,得到增强向量集合;将所述增强向量集合输入预置的用户行为检测模型进行用户行为预测,得到预测用户行为;对所述预测用户行为进行异常分值计算,得到目标异常分值,并通过所述目标异常分值进行行为分析,得到行为分析结果,其中,所述行为分析结果为异常或正常。
-
公开(公告)号:CN110957015B
公开(公告)日:2023-04-28
申请号:CN201911210250.7
申请日:2019-12-02
Applicant: 南开大学
IPC: G16H10/60 , G16H50/70 , G06F18/214 , G06N3/084
Abstract: 本发明提出了一种结合患者特征缺失规律的电子医疗记录数据的缺失值填充方法。本发明方法是构建由两个循环神经网络构成的联合模型,综合利用未缺失医疗数据的数值信息与患者特征的缺失规律,以判断患者生理状态并提取对应的状态特征,从而根据对应时刻患者的生理状态对各个特征缺失的值进行推断,实现合乎客观事实的患者特征缺失值的填充。对于缺失规律是非随机性的电子医疗记录数据,本发明方法的效果显著优于其他未考虑缺失规律的数据填充模型,证明医疗数据中的非随机缺失性质有助于模型判断患者生理状态,并且有益于模型对数据缺失值进行合理地填充。
-
公开(公告)号:CN110827265B
公开(公告)日:2023-04-07
申请号:CN201911079051.7
申请日:2019-11-07
Applicant: 南开大学
IPC: G06T7/00 , G06V10/764 , G06V10/82 , G06N3/045 , G06N3/0455 , G06N3/094
Abstract: 一种面向图片数据集的基于深度学习的图片异常检测方法。本发明方法是利用正常的图片类别数据作为输入数据,构建基于深度学习的图片异常检测模型,包含两个子模块,一个表示模块用于学习正常类别的图片数据集的特征,一个检测模块用于预测输入图片属于异常图片类别的概率,还使用置信度估计来提高预测准确率,两个模块采用对抗式训练方法,表示模块可以更好的学习到正常类别图片数据集的特征,检测模块则可以给出置信度更高更准确的预测结果。对于异常检测领域的四个常用数据集,本发明的方法克服了异常类别图片种类繁多难以收集的问题,只需要正常类别的图片作为训练数据,同时效果显著优于目前现有的其他面向图片数据集的异常检测方法。
-
公开(公告)号:CN115827898A
公开(公告)日:2023-03-21
申请号:CN202211692521.9
申请日:2022-12-28
Applicant: 南开大学
IPC: G06F16/36 , G06F16/9537 , G06Q50/00
Abstract: 本发明属于数据挖掘技术领域,具体涉及基于位置服务的社交网络时空数据,特别是一种面向用户意图的时空知识图谱构建方法。该方法包括如下步骤:第1步、数据采集并对其进行预处理,进而构建能够直接输入模型的用户、地点、类别、时间槽和地理位置编码的ID;第2步、利用预处理后的数据建立访问序列向量,构建用户出行意图向量;第3步、构建时空知识图谱模型,生成对应的三元组(u,(rseq,rpur),v),用于记录用户u在移动行为rseq后,根据出行意图目的rpur,进行了位置地点v的访问;第4步、根据给定用户的历史访问序列和出行意图进行位置预测。
-
-
-
-
-
-
-
-
-