-
公开(公告)号:CN118607581A
公开(公告)日:2024-09-06
申请号:CN202410743656.6
申请日:2024-06-11
Applicant: 华南农业大学
IPC: G06N3/042 , G06N3/0464 , G06N3/045 , G06N3/0985
Abstract: 本发明公开了一种基于多层感知图神经网络的链路预测方法及装置。本申请通过词向量模型获取待预测知识图谱中各节点的词向量;根据各节点的所述词向量以及随机生成的各节点的初始节点特征向量,获取各节点的第一嵌入向量;将各节点的所述第一嵌入向量添加到预设的图结构的节点数据中,并通过HGT模型对所述图结构进行训练,获取各节点的第二嵌入向量;所述HGT模型包含若干层HGT网络层;将所述第二嵌入向量输入至预设的MLP模型中,并通过所述MLP模型输出的结果,获取各节点之间的链路预测结果。通过本申请,可以解决同质图的传统链路预测方法与知识图谱适配性低的技术问题,提高知识图谱的链路预测准确性。
-
公开(公告)号:CN118709685B
公开(公告)日:2025-01-10
申请号:CN202411164348.4
申请日:2024-08-23
Applicant: 华南农业大学
IPC: G06F40/284 , G06F18/22 , G06F18/23
Abstract: 本发明申请提供了一种汉语词汇消歧方法、装置、终端设备及存储介质,方法包括:获取目标汉语词汇,根据所述目标汉语词汇和预先训练好的跨语言模型,获得所述目标汉语词汇的长释义词向量表达和所述目标汉语词汇在目标句中的多义词词向量表达,长释义词向量表达根据预设映射关系确定;分别计算多义词词向量表达与每个长释义词向量表达之间的相似度,根据相似度最高的长释义词向量表达,对所述目标句中的目标汉语词汇进行消歧。本发明申请相比现有技术单纯依赖汉语知识库的技术方案,可以通过外语知识库增强汉语知识库,提升其丰富性和精细度,弥补汉语知识库资源的不足,从而提升释义的准确性。
-
公开(公告)号:CN115730080A
公开(公告)日:2023-03-03
申请号:CN202211392156.X
申请日:2022-11-08
Applicant: 华南农业大学
Abstract: 本申请属于技术路线图构建技术领域,公开了一种基于语义挖掘的技术路线图构建方法及系统。通过获取文本数据,确认所述文本数据的摘要文本,利用Textrank算法对所述摘要文本进行关键句提取,得到所述摘要文本的关键句;将所述摘要文本的关键句输入到Bert模型中进行向量化表达,将所述向量化表达进行加权融合,得到所述关键句的向量表示;将所述关键句的向量表示输入到文档主题生成模型中提取所述向量表示的聚类主题;计算所述聚类主题的语义相似度,并根据所述语义相似度绘制技术路线图。实现提高构建技术路线图的准确性。
-
公开(公告)号:CN113886588A
公开(公告)日:2022-01-04
申请号:CN202111220573.1
申请日:2021-10-20
Applicant: 华南农业大学
IPC: G06F16/35
Abstract: 本发明公开了一种基于招聘文本挖掘的专业主要就业方向识别方法,该方法以招聘网站的招聘信息为数据来源,通过主要数据采集、数据预处理、词向量化和K‑means聚类4个步骤,对专业的招聘岗位名称进行分析,得到专业的主要就业方向。本发明基于文本挖掘的专业分方向人才培养研究方法可以快速、高效、准确地从网络招聘文本数据中识别出就业市场对专业人才的就业方向需求,能够为高校优化和改进专业的人才培养方案,培养符合市场需求的专业方向人才提供决策支持。
-
公开(公告)号:CN118709685A
公开(公告)日:2024-09-27
申请号:CN202411164348.4
申请日:2024-08-23
Applicant: 华南农业大学
IPC: G06F40/284 , G06F18/22 , G06F18/23
Abstract: 本发明申请提供了一种汉语词汇消歧方法、装置、终端设备及存储介质,方法包括:获取目标汉语词汇,根据所述目标汉语词汇和预先训练好的跨语言模型,获得所述目标汉语词汇的长释义词向量表达和所述目标汉语词汇在目标句中的多义词词向量表达,长释义词向量表达根据预设映射关系确定;分别计算多义词词向量表达与每个长释义词向量表达之间的相似度,根据相似度最高的长释义词向量表达,对所述目标句中的目标汉语词汇进行消歧。本发明申请相比现有技术单纯依赖汉语知识库的技术方案,可以通过外语知识库增强汉语知识库,提升其丰富性和精细度,弥补汉语知识库资源的不足,从而提升释义的准确性。
-
公开(公告)号:CN117556045A
公开(公告)日:2024-02-13
申请号:CN202311534648.2
申请日:2023-11-17
Applicant: 华南农业大学
IPC: G06F16/35 , G06F16/36 , G06F16/34 , G06Q10/1053 , G06Q50/20 , G06N3/048 , G06N3/047 , G06N3/084
Abstract: 本发明公开了一种基于胜任力的招聘文本专业知识点分类方法及装置,方法包括:收集招聘文本数据并进行数据预处理,并按照冰山模型对数据集进行标注;在Bert模型的顶部添加全连接层和Softmax层,构建网络招聘文本知识点分类模型;确定模型参数后利用已打标数据集训练模型,并对模型进行微调,获取训练好的网络招聘文本知识点分类模型;利用招聘文本分类数据获取与每类招聘岗位高度关联的细分知识点;对招聘岗位类别划分并计算知识点与招聘岗位的相关度,从而进一步获取与每类招聘岗位高度关联的细分知识点;最后对细分知识点进行可视化。本发明提供了一种全新的文本分类的方法,为人才培养与大学生精准就业提供有力工具与保障。
-
公开(公告)号:CN115879463A
公开(公告)日:2023-03-31
申请号:CN202211249113.6
申请日:2022-10-12
Applicant: 华南农业大学
IPC: G06F40/289 , G06F40/242 , G06N3/0442 , G06N3/049 , G06N3/084
Abstract: 本发明涉及一种基于文本挖掘的课程元素识别模型训练及识别方法。训练方法包括:构建目标框架,目标框架设有若干个维度和各个维度对应的元素;从政治课程和专业课程的教材中采集文本数据并预处理;对预处理后的文本数据进行分块得到文本数据块;根据若干个维度和各个维度对应的元素对文本数据块进行人工标注得到对应的标签;对文本数据块进行分词处理和词向量化处理得到词向量数据集;构建文本挖掘模型,基于词向量数据集和人工标注的标签对文本挖掘模型进行训练和测试得到最终的文本挖掘模型。本发明利用该文本挖掘模型可对教材中所蕴含的维度和元素进行提取和识别。
-
公开(公告)号:CN119962540A
公开(公告)日:2025-05-09
申请号:CN202510022895.7
申请日:2025-01-07
Applicant: 华南农业大学
IPC: G06F40/30 , G06F40/284 , G06N5/022 , G06N5/04 , G06F16/35 , G06F18/23 , G06F18/25 , G06F18/22 , G06N20/00
Abstract: 本申请公开了一种无监督汉词语消歧方法、装置、终端设备及存储介质。本申请对用户输入的文本数据进行文本分割,获取若干词语,并依次提取各所述词语的多层特征;多层特征包括:第一语义层特征;对各所述词语的所述第一语义层特征进行迭代更新,每次更新时,根据各词语的多层特征,更新预设的语义图谱,以更新各词语对应节点的第一融合特征;并将第一融合特征输入至预训练完毕的消歧模型中,获取对应词语的第二语义层特征,以更新对应节点的第一语义层特征;直至各词语对应前后获取的第二语义层特征之间的第一余弦相似度小于预设值,根据当前获取的第二语义层特征,确定对应词语的语义表示。通过本申请,可以提高语义图谱以及消歧结果的准确性。
-
公开(公告)号:CN112861530A
公开(公告)日:2021-05-28
申请号:CN202110287512.0
申请日:2021-03-17
Applicant: 华南农业大学
IPC: G06F40/289 , G06K9/62 , G06F16/215 , G06F16/2458 , G06F16/26 , G06F16/951 , G06Q50/20
Abstract: 本发明公开了一种基于文本挖掘的课程设置分析方法,该方法包括:根据确定的数据搜索关键词,从选定的招聘网站中采集研究专业的招聘要求数据和非研究专业的招聘要求数据;对采集的招聘要求数据进行预处理操作;提取招聘要求数据中的知识点,并构建知识词库;对知识词库中的知识点进行聚类分析,并将分类后的知识点归类到课程,获得就业市场对该专业的课程需求。本发明利用文本挖掘技术获取就业市场对人才的知识要求,通过课程归类得到课程需求,无需大量耗费时间和人力进行调研就能快速获得合理的课程设置建议,能在各个专业领域进行快速应用推广,为高校课程设置的优化和改进提供决策支持。
-
公开(公告)号:CN112487192A
公开(公告)日:2021-03-12
申请号:CN202011487942.9
申请日:2020-12-16
Applicant: 华南农业大学
IPC: G06F16/35 , G06F40/194 , G06F40/211 , G06F40/289 , G06F40/30 , G06K9/62
Abstract: 本发明提出一种基于TRIZ的中文专利语料库半自动构建方法,是对40个TRIZ发明原理进行重组,使重新分组的发明原理类别之间存在较大的歧义,类内的歧义就相对较小,进一步提升语料库的质量。专利文本包含很多低频的领域术语,利用一般的中文分词将破坏完整的术语,本法能采集到较为完整的术语关键词,为专利语义分析提供良好的基础。关键词所能提供的语义信息有限,本法还对句子进行依存句法解析,获取更充分的语义信息让机器识别更准确,还有助于非领域专业人员对句子的理解进而更好地完成少量的标注工作。本法基于表示学习方法抽取专利文本的句子、依存特征,捕获更深层次、更为抽象的专利语义表示,将能抽取到最具判别性的特征从而有助于文本的聚类。
-
-
-
-
-
-
-
-
-