-
公开(公告)号:CN115935996A
公开(公告)日:2023-04-07
申请号:CN202211652300.9
申请日:2022-12-21
Applicant: 华南农业大学
IPC: G06F40/295 , G06F16/36 , G06V10/80 , G06N3/045 , G06N3/0442 , G06N3/084
Abstract: 本发明提供一种结合知识图谱和口语化文本的细粒度蝴蝶识别方法,属于图像识别领域,该方法包括:获取多种蝴蝶图像和描述蝴蝶的文本,并将蝴蝶图像和描述蝴蝶的文本一一对应;提取蝴蝶图像的模态特征和描述蝴蝶的文本的模态特征;将描述蝴蝶的文本模态信息链接到构建好的蝴蝶形态的知识图谱;结合蝴蝶形态的知识图谱并根据蝴蝶图像模态和描述蝴蝶的文本模态,输出蝴蝶图像的蝴蝶种类的识别结果。本发明能够结合知识图谱和口语化文本辅助细粒度蝴蝶识别,有效的提升细粒度蝴蝶识别的精确性和鲁棒性。
-
公开(公告)号:CN115952803A
公开(公告)日:2023-04-11
申请号:CN202211659362.2
申请日:2022-12-22
Applicant: 华南农业大学
IPC: G06F40/30 , G06F40/126 , G06N3/04 , G06N3/08 , G06N20/00
Abstract: 本发明提供一种主题感知的长文本语义匹配方法,该方法包括:对长文本A进行摘取和重排,输出摘取文本A’;对长文本B进行摘取和重排,输出摘取文本B’和基准摘取文本B’base;计算 的相关性,如果计算出的相关性符合条件则认为长文本A和长文本B是语义相关,如果不符合条件则认为长文本A和长文本B是不相关的。本发明不需要人工标注匹配文本的具体匹配语句位置,能够自动进行语句划分和文本匹配,大大提高了长文本作语义相关的匹配和检索效率。
-
公开(公告)号:CN116187330A
公开(公告)日:2023-05-30
申请号:CN202211659583.X
申请日:2022-12-22
Applicant: 华南农业大学
IPC: G06F40/295 , G06F40/126 , G06F18/24 , G06F18/214
Abstract: 本发明公开了一种自监督伪标签优化的跨语言命名实体识别方法及系统,该方法包括:根据用户获得目标语言伪标签数据集的功能需求,利用源语言数据集训练源语言模型来并利用源语言模型为用户进行目标语言的标注工作,提供给用户目标语言的伪标签数据集;将目标语言的伪标签数据集进行粗粒度选择;将粗粒度选择后的伪标签数据集进行细粒度过滤;将细粒度过滤后的伪标签数据集进行知识蒸馏训练用于目标语言的命名实体识别模型。本发明提出一种自监督伪标签优化的跨语言命名实体识别方法及系统,基于粗粒度选择与细粒度过滤选择了有效的伪标签数据样本且改善了跨语言命名实体的效果。
-
-