-
公开(公告)号:CN119669428B
公开(公告)日:2025-05-06
申请号:CN202510175026.8
申请日:2025-02-18
Applicant: 华南理工大学
IPC: G06F16/3329 , G06N5/022 , G06N5/04
Abstract: 本发明为数据处理技术领域,公开了一种融合知识图谱和大模型的智能问答方法、装置及存储介质,包括:获取待答复的原始问题;对原始问题进行实体抽取生成实体信息集,进行问题重写生成原始问题的相似问题;遍历实体信息集中的每一个实体信息,基于融合相似问题的搜索策略在预设知识图谱中进行搜索与筛选,获取知识路径;根据知识路径获得知识,根据任务指令和原始问题,通过答案生成大模型结合所获得的知识进行逻辑推理,生成原始问题的预测答案;对预测答案进行真实性检测,对预测答案进行过滤,生成目标答案。本发明降低了大模型产生不实或无关信息的可能性,降低了计算成本,缓解了大模型生成答案的幻觉问题,提升了答案的可信度和精确度。
-
公开(公告)号:CN114359956B
公开(公告)日:2024-05-10
申请号:CN202111499395.0
申请日:2021-12-09
Applicant: 华南理工大学
IPC: G06V40/10 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0455 , G06N3/0475 , G06N3/0464 , G06N3/0895 , G06N3/094
Abstract: 本发明公开了一种基于图像转换的半监督行人检测方法,首先在目标场景用少量的标注数据训练一个初始检测器,对目标场景和外部场景的无标注数据作预测,作为伪标注,截取出行人图像。然后用目标场景和外部场景的行人图像训练一个用于图像转换的神经网络,行人的风格和内容被解耦,在保持行人内容一致性的同时,可将外部场景的行人图像转换成目标场景的风格。转换后的行人图像被用于训练一个分类器,进一步筛选出半监督行人检测中的伪标注,得到更高质量的伪标注。伪标注与少量的标注数据一起作为训练数据,训练一个新的行人检测的检测器,提升行人检测的性能,完成行人检测的任务,最终得到更好的行人检测效果。
-
公开(公告)号:CN114913057A
公开(公告)日:2022-08-16
申请号:CN202210535719.X
申请日:2022-05-17
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于生成对抗学习的人脸妆容迁移方法,包括:S1、准备三个不同的数据集;S2、将原始图像的风格转换成处理图像的风格;S3、使用预训练的人脸分割模型对图像中的人脸进行区域划分;S4、将上妆后的图像中的妆容迁移到未上妆的处理图像,完成人脸妆容迁移的任务。本发明使用易于收集的质量较低的人脸图像作为原始数据,结合图像增强模型(即神经网络),训练一个用于人脸妆容迁移的模型(即神经网络),以提升人脸妆容迁移的适用性。
-
公开(公告)号:CN110992079A
公开(公告)日:2020-04-10
申请号:CN201911087236.2
申请日:2019-11-08
Applicant: 华南理工大学
IPC: G06Q30/02 , G06K9/62 , G06F40/289 , G06F40/126
Abstract: 本发明公开了一种基于时间序列填补的商品点击率预测方法,包括以下步骤:获取商品点击率相关数据,并对其数据进行预处理;对商品点击率相关数据进行特征提取并融合,得到商品特征;通过商品特征进行相似度计算;将相似度高的商品在相应时间段商品点击率数据进行填补序列缺失值,得到点击率完整时间序列;利用点击率完整时间序列,通过长短期记忆网络进行商品点击率预测,最后输出商品点击率预测值;本发明采用时间序列填补的方法,结合多种有效特征,对多模特征进行融合,使用商品的多模态特征进行相似商品的查找和数据替代,填补完整的时间序列,更接近真实值,解决时间序列的非连续性问题,进而准确预测商品点击率。
-
公开(公告)号:CN119784670A
公开(公告)日:2025-04-08
申请号:CN202411558780.1
申请日:2024-11-04
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于文本引导的零样本工业缺陷检测方法、设备及介质,其中方法包括:获取工业产品的图像以及文本语义标签,构建训练集和测试集;构建基于文本引导的零样本工业缺陷检测模型,采用训练集对模型进行训练;将测试集输入训练后的模型中进行测试;其中,在训练阶段,模型利用部分种类的工业产品中的缺陷信息,学习并扩展到其他工业产品的统一文本提示;在测试阶段,模型能够在从未训练过的工业产品种类上进行测试,检测其是否存在缺陷并定位缺陷。本发明充分利用预训练多模态大模型CLIP中蕴含的先验知识,使模型能够自适应地学习针对不同物体的通用文本提示,实现对各种工业产品的零样本缺陷检测,可广泛应用于计算机视觉技术领域。
-
公开(公告)号:CN117893657A
公开(公告)日:2024-04-16
申请号:CN202410012337.8
申请日:2024-01-02
Applicant: 华南理工大学
IPC: G06T15/00 , G06T9/00 , G06V40/16 , G06V10/77 , G06V10/74 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0455
Abstract: 本发明公开了一种基于语言引导三维模型的人脸图像属性控制方法及系统,该方法包括下述步骤:人脸图像经编码器得到原始潜在代码,原始潜在代码经生成器得到反演图像,反演图像经三维重建器得到原始的三维表示,原始的三维表示经渲染器得到三维渲染图像,三维渲染图像经图像编码器得到图像嵌入,语言属性描述经语言编码器得到语言嵌入,图像嵌入映射到属性嵌入空间中,受到语言嵌入指引的图像嵌入映射回图像空间,经映射网络得到目标三维表示,目标三维表示与原始的三维表示的残差与原始潜在代码一并输入到跨模态映射网络中,进而输出潜代码残差,潜代码残差与原始潜在代码相加后经生成器输出二维人脸图像。本发明实现了更加细粒度的面部属性控制。
-
公开(公告)号:CN117636372A
公开(公告)日:2024-03-01
申请号:CN202311477916.1
申请日:2023-11-07
Applicant: 华南理工大学
IPC: G06V30/22 , G06V30/19 , G06V30/148 , G06V10/82 , G06V30/18 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种手写汉字相似度度量方法、系统、装置及存储介质,其中方法包括:获取字帖图像;将字帖图像输入汉字分割模型,获得多个待评分的手写汉字图像;将手写汉字图像输入汉字分类模型,获得手写汉字的类别;根据手写汉字的类别,从标准库中获取对应的标准汉字,并一起输入汉字空间对齐模型,获得与标准汉字对齐后的手写汉字;将对齐后的手写汉字和其对应的标准汉字,输入笔画分割模型,得到二者的笔画分割结果;将笔画根据类似交并比的计算方式获得手写汉字与其对应标准汉字对比后的相似度。本发明对手写汉字和标准汉字二者分割出来的笔画进行相似度计算,为评价手写汉字或其他研究提供帮助,可广泛应用于图像模式识别技术领域。
-
公开(公告)号:CN116612478A
公开(公告)日:2023-08-18
申请号:CN202310317071.3
申请日:2023-03-28
Applicant: 华南理工大学 , 广州伟度计算机科技有限公司
IPC: G06V30/19 , G06V30/244 , G06V10/82 , G06N3/0464 , G06N3/088
Abstract: 本发明公开了一种脱机手写汉字的评分方法、装置及存储介质,其中方法包括:获取待评分的手写汉字图像;将手写汉字图像输入训练后的汉字评分模型,提取手写汉字的特征结构,将提取的特征结构与标准库中对应的汉字进行对比分析,获得手写汉字的综合评分;和/或,基于汉字像素点的分布规律,分析手写汉字图像中汉字像素点的二维分布,获得多种二维特征,根据获得的多种二维特征与标准库中对应的汉字进行对比分析,获得手写汉字不同维度上的评分。本发明通过模型对手写文字图像进行处理,或者根据汉字像素点对手写文字图像进行处理,能够对手写汉字进行整体评分,为书写者提供改进参考。本发明可广泛应用于图像模式识别技术领域。
-
公开(公告)号:CN115546537A
公开(公告)日:2022-12-30
申请号:CN202211162789.1
申请日:2022-09-23
Applicant: 华南理工大学
IPC: G06V10/764 , G06V10/80
Abstract: 本发明公开了一种基于生成对抗模型的图像多属性联合编辑方法,该方法包含两个可学习的组件:一个内容感知语义方向预测器,用于学习和推断一组语义方向,这些语义方向与输入图像相对应且与预设的语义属性相关联;一个语义方向融合网络用于非线性地融合与目标属性相关的语义方向,最终产生一个可以用于编辑多属性的语义方向。在此基础之上,通过施加基于属性感知特征的一致性正则化,进一步保证了编辑图像在不相关属性的保存,使得本发明在目标属性操控的准确性和不相关属性的保持能力都优于现有的方法。
-
公开(公告)号:CN112381148B
公开(公告)日:2022-06-14
申请号:CN202011282976.4
申请日:2020-11-17
Applicant: 华南理工大学
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于随机区域插值的半监督图像分类方法,该方法从训练集中选取少量有真实标签的图像,剩下其它图像作为无真实标签图像;两类图像同时送入到随机区域插值模块;插值的过程会有所不同,带有真实标签图像可以直接通过插值生成新的增广图像,但是无真实标签图像无法正常插值,所以会先通过教师网络获得高置信度的标签信息作为无真实标签图像的临时标签,然后再进行插值操作;用新的增广图像对网络进行训练,直到网络模型训练到预先设定的次数。本发明方法是同时对两类图像进行随机区域插值,生成新的增广图像用于训练分类网络,提高了训练模型的泛化性能。
-
-
-
-
-
-
-
-
-