-
公开(公告)号:CN115827881A
公开(公告)日:2023-03-21
申请号:CN202111088382.4
申请日:2021-09-16
IPC: G06F16/36 , G06F16/33 , G06F40/211 , G06F40/289 , G06F40/30 , G06V30/14 , G06Q50/14
Abstract: 一种基于旅游知识图谱的多模态旅游信息定位式检索方法,根据图文游记和旅游视频混合数据库中的多模态数据构建带有权值的旅游知识图谱,并在构建和更新过程中保存实体和实体间关系对数据源的语义位置索引,用户进行文本搜索时对文本抽取搜索实体和搜索实体间的关系,映射到知识图谱的一个子图,对该子图增强扩展后根据对应索引返回检索结果。本发明对检索文本返回的结果同样是多模态的,并且指向语义对应的位置。对于数据库中的游记数据,返回增强后子图对应的文本和图片及所在游记;对于数据库中的旅游视频数据,返回增强后子图对应的视频片段和整个视频。本发明解决了多模态数据难以有效管理,且旅游数据检索难以定位到目标语义单位的问题。
-
公开(公告)号:CN115828919A
公开(公告)日:2023-03-21
申请号:CN202111089506.0
申请日:2021-09-16
IPC: G06F40/30 , G06F40/289 , G06F40/211 , G06N3/0464 , G06N3/08
Abstract: 一种基于图像和文本特征抽取的游记图文匹配方法,对于图像特征抽取,首先使用深度网络从图像中检测物体,导出图像特征并对每个物体提取物体特征,然后联合物体特征和图像特征进行编码;对于文本特征抽取,首先对文本进行分词,然后使用深度网络分别从词语层面和语句层面导出文本特征,接着联合词语特征和语句特征进行编码;最后对编码后的图像特征和文本特征计算余弦相似度,根据图文的相似度设定阈值,在文本对应位置选择图片插入。本发明解决游记编辑时图片选择和插入需要花费大量精力的问题。
-
公开(公告)号:CN115827882A
公开(公告)日:2023-03-21
申请号:CN202111088394.7
申请日:2021-09-16
IPC: G06F16/36 , G06F16/33 , G06F40/211 , G06F40/295 , G06F40/30 , G06V30/14 , G06Q50/14
Abstract: 一种基于多模态旅游大数据的知识图谱构建方法,从多模态的旅游数据抽取实体和实体间的关系,首先进行数据获取,从旅游垂直网站获取半结构化城市、景点数据,以及非结构化的游记数据,从视频网站获取非结构化的旅游视频;然后进行数据预处理,对游记文本数据进行文本分析,对游记图片数据进行物体识别,对视频数据进行物体跟踪和场景文字识别,并对场景文字进行文本分析;接着从文本分析后的游记文本、视频场景文字文本和图片物体、视频物体中抽取实体;最终根据结构关系和句法依存关系挖掘实体间语义关系,从而构建旅游知识图谱。本发明利用互联网旅游大数据构建知识图谱,能够有效地管理和利用多种模态的数据,为检索、推荐等旅游服务提供支持。
-
公开(公告)号:CN118736482A
公开(公告)日:2024-10-01
申请号:CN202410717483.0
申请日:2024-06-04
Applicant: 南京大学
IPC: G06V20/52 , G06V20/70 , G06V10/143 , G06V10/26 , G06V10/40 , G06V10/766 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/084 , G06N3/09
Abstract: 基于视觉大模型语义引导的RGB‑T人群计数方法、设备及介质,首先分别将SAM应用于RGB和热模态,使用语义作为提示来获得每个模态的语义;然后模块融合最高层的语义、模态和计数信息,并使用多头自注意机制增强特征;再将融合的特征和较低层的图像特征输入到多级解码器中,生成计数令牌和密度图;最后密度图通过回归头进行处理,得到最终的计数结果。本发明针对RGB‑T人群计数中存在误检测和漏检测的问题,利用SAM大型模型的分割优势,有效地整合了语义和模态信息,提高了计数过程的准确性和鲁棒性。
-
公开(公告)号:CN110210423B
公开(公告)日:2023-04-25
申请号:CN201910488308.8
申请日:2019-06-05
Applicant: 南京大学
IPC: G06V20/52 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 一种基于多层级回归的人群密度估计方法,将人群图像划分为不同拥挤程度的人群区域及背景,对各个划分出的区域采用不同的密度回归器生成相应的密度图,并最终合并各个密度图生成整幅图像的密度图用于人数估计。本发明利用多层级回归处理不同拥挤程度的人群图像区域,有效解决了不同场景下人的外观、尺寸、面积等变化引起的人群密度估计准确率受限问题,提高了人群密度估计的准确率。
-
公开(公告)号:CN108898614B
公开(公告)日:2022-06-21
申请号:CN201810569130.5
申请日:2018-06-05
Applicant: 南京大学
Abstract: 一种基于层次式时空区域合并的物体轨迹提议方法,在视频上通过匹配相邻帧的层次式视频帧区域构建视频的层次式时空区域表示,然后通过合并层次式时空区域来产生候选物体轨迹,最后使用一种融合了外观似物性和运动似物性的综合评分机制对候选物体轨迹进行评分,将评分最高的若干个候选物体轨迹作为最终的物体轨迹提议结果。本发明方法融合了视频中物体的外观信息和运动信息,利用整个视频的时空特性来生产物体轨迹提议结果,取得了比现有方法更好的效果。
-
公开(公告)号:CN111504208A
公开(公告)日:2020-08-07
申请号:CN202010435107.4
申请日:2020-05-21
Applicant: 南京鸿亦沄智能科技有限公司 , 南京大学
Abstract: 一种基于计算机视觉的非接触式树木胸径测量方法及系统,硬件设备包括:RFID标签、智能手机、RFID读写设备、手持设备;通过智能手机拍得带有彩色标签的树木躯干照片,将该照片传至服务器进行图像处理,处理后获得待测树木的胸径,所述彩色标签附有RFID标签,同时由RFID读写设备识别树木RFID标签,并在服务器中将测得的树木胸径与该树木的RFID标签对应存储。本发明实施例中设备装置简单、便于携带,整个系统可提升树木测量与管理的效率。
-
公开(公告)号:CN110210423A
公开(公告)日:2019-09-06
申请号:CN201910488308.8
申请日:2019-06-05
Applicant: 南京大学
Abstract: 一种基于多层级回归的人群密度估计方法,将人群图像划分为不同拥挤程度的人群区域及背景,对各个划分出的区域采用不同的密度回归器生成相应的密度图,并最终合并各个密度图生成整幅图像的密度图用于人数估计。本发明利用多层级回归处理不同拥挤程度的人群图像区域,有效解决了不同场景下人的外观、尺寸、面积等变化引起的人群密度估计准确率受限问题,提高了人群密度估计的准确率。
-
公开(公告)号:CN107203748A
公开(公告)日:2017-09-26
申请号:CN201710350594.2
申请日:2017-05-18
Applicant: 南京大学
Abstract: 本发明公开了一种基于内容的网页笔记存储、匹配和还原的方法和装置。其中,方法步骤如下:首先获取用户在网页浏览页面上输入的笔划,将笔划组合成笔划组,计算笔划组所对应的网页元素。然后按网页地址存储笔记信息。当显示网页时,根据网页地址检索查找对应的笔记信息,将找到的笔记信息中各个笔划组所对应的网页元素与当前网页中的网页元素进行匹配;最后根据匹配的结果从所找到的笔记信息中提取相应的笔划组进行还原。本发明方法之下,当网页内容发生变化时,只要笔记所对应的内容未发生变化,即可再现笔记,由此无视其他网页内容的变化。
-
公开(公告)号:CN106373162A
公开(公告)日:2017-02-01
申请号:CN201510435772.2
申请日:2015-07-22
Applicant: 南京大学
IPC: G06T7/90
Abstract: 一种基于显著性融合与传播的显著物体检测方法,针对RGB-D图像,首先分别利用图像的颜色特征和空间特征进行显著物体检测,然后通过融合二者的结果得到一个高准确率的显著性图,最后通过一种基于块的显著性传播方法来扩大显著区域和提高显著物体的完整性。本发明充分发掘了RGB-D图像的彩色通道和深度通道,利用颜色特征和空间特征进行显著性检测,并采用融合-传播策略提高检测结果的准确率和召回率,能够应对在RGB-D图像中检测显著物体的任务,并能够取得比现有方法更优秀的效果。
-
-
-
-
-
-
-
-
-