大规模跨语言知识图谱间的无监督实体对齐方法和系统

    公开(公告)号:CN117150034A

    公开(公告)日:2023-12-01

    申请号:CN202310987699.4

    申请日:2023-08-07

    Applicant: 海南大学

    Abstract: 本发明公开大规模跨语言知识图谱间的无监督实体对齐方法和系统,属于实体对齐领域。在特征嵌入阶段,基于知识图谱的多视图信息,从语义和字符两个层面进行嵌入。语义层面,使用预训练的大语言模型(LLM,Large Language Model)进行嵌入。字符层面,使用N‑Gram模型进行嵌入。在对齐阶段,先融合多视图信息,分别生成语义和字符层面的相似度矩阵。再采用加权的方式融合语义和字符的相似度矩阵,生成对齐矩阵。最后,依据对齐矩阵完成对齐任务。本发明不需要事先进行任何数据标注,属于无监督的实体对齐;语义和字符两个层面的特征嵌入,更好地捕获了待对齐实体特征;组合语义特征和字符特征,提高了对齐准确度并保证对齐效率,适用于各种跨语言知识图谱间的实体对齐任务。

    基于BlendMask的实体识别、知识图谱生成方法及系统

    公开(公告)号:CN114998702A

    公开(公告)日:2022-09-02

    申请号:CN202210466825.7

    申请日:2022-04-29

    Applicant: 海南大学

    Abstract: 本发明公开了一种基于BlendMask的实体识别、知识图谱生成方法及系统,其中,采用BlendMask改进模型对每张图像依次进行图像预处理、特征融合、图像分割和实体识别操作,从而得到图像中各个实体的分割区域、实体名和精确度;另外,本发明将从文本中提取的实体、类别以及关系信息,与从图像中识别的实体信息结合,以类别和实体作为节点,并以关系为边生成对应的知识图谱。由于本发明对现有的BlendMask模型进行了改进:在特征融合操作中采用7*7的空洞卷积核;空洞卷积核能够在扩大感受野的同时不降低图像分辨率,因此本发明提供的实体识别方法更加精准,对应的图谱生成方法也更加全面。

    一种基于知识图谱的推荐新闻方法

    公开(公告)号:CN118051604B

    公开(公告)日:2024-10-29

    申请号:CN202410027854.2

    申请日:2024-01-09

    Applicant: 海南大学

    Abstract: 本发明公开了一种基于知识图谱的推荐新闻方法,包括:根据新闻资料库,构建新闻知识图谱;获取用户正在浏览的第一新闻文本,确定第一新闻文本对应的关键词集、关系属性;关系属性包括出版时间、出版区域、隶属领域;基于第一新闻文本对应的关键词集和关系属性,与新闻知识图谱中的三元组进行相似度计算,获得第一新闻文本与新闻知识图谱中三元组的匹配值;根据匹配值,确定目标关键词集;根据目标关键词集,在新闻资料库中确定目标新闻文本;将目标新闻文本推送至新闻客户端,用以用户浏览。由此,能够依据新闻的特殊性,构建新闻知识图谱,并且能够结合知识图谱匹配度、用户个性化特征,为用户推荐准确度高且具备一定多样化的新闻文本内容。

    一种基于中文仿生文献摘要的句子分类方法及系统

    公开(公告)号:CN114860937B

    公开(公告)日:2024-08-06

    申请号:CN202210535985.2

    申请日:2022-05-17

    Applicant: 海南大学

    Abstract: 本发明提供了一种基于中文仿生文献摘要的句子分类方法及系统,属于文本分类领域,方法为:对句子数据库中未进行人工标注句子类别的句子分别采用词频分析方法和输入初始Bert模型中进行分类;将第一分类结果集和第二分类结果集中分类结果一致的句子存入分类数据库;在第一分类结果集中剔除分类数据库中的句子,采用本次迭代后的Bert模型对第一分类结果集再次分类,更新第一分类结果集;采用较上次迭代更小的分词粒度的词频分析方法对第二分类结果集再次分类,更新第二分类结果集;依次类推,实现句子分类。本发明减少实体抽取和关系抽取中的人工标注,可减少人力和时间的成本。

    一种基于知识图谱的推荐新闻方法

    公开(公告)号:CN118051604A

    公开(公告)日:2024-05-17

    申请号:CN202410027854.2

    申请日:2024-01-09

    Applicant: 海南大学

    Abstract: 本发明公开了一种基于知识图谱的推荐新闻方法,包括:根据新闻资料库,构建新闻知识图谱;获取用户正在浏览的第一新闻文本,确定第一新闻文本对应的关键词集、关系属性;关系属性包括出版时间、出版区域、隶属领域;基于第一新闻文本对应的关键词集和关系属性,与新闻知识图谱中的三元组进行相似度计算,获得第一新闻文本与新闻知识图谱中三元组的匹配值;根据匹配值,确定目标关键词集;根据目标关键词集,在新闻资料库中确定目标新闻文本;将目标新闻文本推送至新闻客户端,用以用户浏览。由此,能够依据新闻的特殊性,构建新闻知识图谱,并且能够结合知识图谱匹配度、用户个性化特征,为用户推荐准确度高且具备一定多样化的新闻文本内容。

    基于BlendMask的实体识别、知识图谱生成方法及系统

    公开(公告)号:CN114998702B

    公开(公告)日:2024-08-02

    申请号:CN202210466825.7

    申请日:2022-04-29

    Applicant: 海南大学

    Abstract: 本发明公开了一种基于BlendMask的实体识别、知识图谱生成方法及系统,其中,采用BlendMask改进模型对每张图像依次进行图像预处理、特征融合、图像分割和实体识别操作,从而得到图像中各个实体的分割区域、实体名和精确度;另外,本发明将从文本中提取的实体、类别以及关系信息,与从图像中识别的实体信息结合,以类别和实体作为节点,并以关系为边生成对应的知识图谱。由于本发明对现有的BlendMask模型进行了改进:在特征融合操作中采用7*7的空洞卷积核;空洞卷积核能够在扩大感受野的同时不降低图像分辨率,因此本发明提供的实体识别方法更加精准,对应的图谱生成方法也更加全面。

    一种基于中文仿生文献摘要的句子分类方法及系统

    公开(公告)号:CN114860937A

    公开(公告)日:2022-08-05

    申请号:CN202210535985.2

    申请日:2022-05-17

    Applicant: 海南大学

    Abstract: 本发明提供了一种基于中文仿生文献摘要的句子分类方法及系统,属于文本分类领域,方法为:对句子数据库中未进行人工标注句子类别的句子分别采用词频分析方法和输入初始Bert模型中进行分类;将第一分类结果集和第二分类结果集中分类结果一致的句子存入分类数据库;在第一分类结果集中剔除分类数据库中的句子,采用本次迭代后的Bert模型对第一分类结果集再次分类,更新第一分类结果集;采用较上次迭代更小的分词粒度的词频分析方法对第二分类结果集再次分类,更新第二分类结果集;依次类推,实现句子分类。本发明减少实体抽取和关系抽取中的人工标注,可减少人力和时间的成本。

Patent Agency Ranking