一种基于分层图对比学习的知识感知多域推荐方法及系统

    公开(公告)号:CN116501956A

    公开(公告)日:2023-07-28

    申请号:CN202310347942.6

    申请日:2023-04-03

    Applicant: 清华大学

    Abstract: 本发明提供一种基于分层图对比学习的知识感知多域推荐方法及系统,包括:获取分层交互网络上多个节点,通过加权求和平滑目标节点和邻居节点进行分层表示,基于分层消息传递机制,通过交互的项目及其连接的实体来聚合更多偏好知识;基于预设的对比学习方法,在分层节点中删除部分节点进行对比学习的数据增强;基于增强后的数据通过在跨多域中域共享图对比学习和在特定域中独域图对比学习,识别目标用户内在的偏好特征;基于目标用户内在的偏好特征进行多任务模型构建,对所述多任务模型进行优化训练生成多域推荐模型,通过所述多域推荐模型完成多域推荐。本发明解决了现有多域推荐难以准确推测用户喜好的问题。

    一种基于预训练的慕课自适应学习系统构建方法和装置

    公开(公告)号:CN114567815B

    公开(公告)日:2023-05-02

    申请号:CN202210068224.0

    申请日:2022-01-20

    Applicant: 清华大学

    Abstract: 本发明公开了一种基于预训练的慕课自适应学习系统构建方法和装置,其中,该方法包括:获取第一预设时间内慕课平台记录的学生学习行为数据,以及预设条件下的辅助信息,辅助信息至少包括课程结构元信息和视频字幕文本;基于学生学习行为数据,以预设的粒度对学习行为日志进行聚合与处理,得到学生学习行为序列;基于辅助信息进行知识挖掘,获取课程结构元信息与视频的初始表示;基于学生学习行为序列和初始表示构建学习行为预训练模型,并采用掩码预测任务训练模型;将学习行为预训练模型应用于学习资源推荐和学习资源评估两个核心下游任务。本发明能够对慕课场景的学习行为、学习资源进行统一建模,构建出性能更强、更通用的自适应学习系统。

    知识图谱的信息补全方法、装置、电子设备及存储介质

    公开(公告)号:CN115964509A

    公开(公告)日:2023-04-14

    申请号:CN202211635657.6

    申请日:2022-12-19

    Applicant: 清华大学

    Abstract: 本发明涉及信息处理技术领域,提供一种知识图谱的信息补全方法、装置、电子设备及存储介质,包括:确定待补全信息序列中的已知元素对应的文本信息;根据文本信息确定文本预测序列;将文本预测序列中的各元素对应的文本信息与已有的知识图谱中各个节点信息和节点关系信息进行语义匹配,确定信息序列;根据信息序列构建用于补全信息的关联路径;根据用于补全信息的关联路径对待补全信息序列中的未知元素进行确定。本发明能够提高确定未知信息的准确性,达到完善知识图谱的目的。

    百科知识图谱动态更新方法、装置、设备及介质

    公开(公告)号:CN115658931B

    公开(公告)日:2023-04-07

    申请号:CN202211681737.5

    申请日:2022-12-27

    Applicant: 清华大学

    Abstract: 本申请涉及计算机技术领域,特别涉及一种百科知识图谱动态更新方法、装置、设备及介质,其中,包括:获取百科知识图谱的待更新数据列表,其中,待更新数据列表包括待更新词条的页面文本和/或词条简介中链接的页面文本;根据预设更新周期遍历待更新数据列表,抽取待更新数据列表中页面文本的预设关键信息,基于预设关键信息更新百科知识图谱中三元组,得到更新结果;对更新结果进行结构化,得到更新后的百科知识图谱,并基于更新后的百科知识图谱更新数据库中存储的百科知识图谱。由此,解决了相关技术中需人工手动修改审核更新,无法自动更新和维护百科知识图谱,导致更新效率较低、维护成本较高等问题。

    基于故事续写和动态知识库的对话生成方法及系统

    公开(公告)号:CN115827838A

    公开(公告)日:2023-03-21

    申请号:CN202211475495.4

    申请日:2022-11-23

    Abstract: 本申请提出一种基于故事续写和动态知识库的对话生成方法及系统,该方法包括:获取用户输入的初始故事,并从初始故事中确定对话角色;构建知识库,从初始故事中抽取出与对话角色相关的知识存入知识库,并获取与知识库中已有知识相关的外部补充知识,以对知识库进行更新;基于更新后的知识库中的知识和初始故事,生成与用户交互的对话,并获取用户返回的对话;抽取对话内容中的事件知识,并基于初始故事和事件知识进行故事续写,将续写后的故事存入知识库;基于续写后的故事,循环进行知识库的更新、与用户的交互对话和故事续写,直至对话结束。该方法基于动态知识库和角色故事续写的框架生成对话,提高了与AI对话的拟真度和趣味性。

    故事脉络构建方法、装置、电子设备和存储介质

    公开(公告)号:CN115033668B

    公开(公告)日:2022-11-11

    申请号:CN202210965268.3

    申请日:2022-08-12

    Applicant: 清华大学

    Abstract: 本发明涉及自然语言处理技术领域,提供一种故事脉络构建方法、装置、电子设备和存储介质,包括:获取待构建脉络的新闻集合;基于关系检测模型,对新闻集合中的每两个新闻进行脉络关系检测,得到每两个新闻之间的脉络关系检测结果;基于每两个新闻之间的脉络关系检测结果,构建新闻集合对应的故事脉络;关系检测模型基于正样本对和负样本对训练得到,正样本对基于话题相同、时间相邻且事件不同的样本新闻确定,负样本对基于话题相同且时间间隔的样本新闻和/或话题不同的样本新闻确定,样本新闻的话题和事件基于聚类得到。本发明在无需人工参与的情况下,提高了数据集构建的效率和可靠性,扩张了数据集规模,保障了故事脉络构建的可靠性和准确性。

    一种为中英文单词对预测义原树的方法及系统

    公开(公告)号:CN112579794B

    公开(公告)日:2022-11-11

    申请号:CN202011565924.8

    申请日:2020-12-25

    Applicant: 清华大学

    Abstract: 本发明实施例提供一种为中英文单词对预测义原树的方法及系统,包括:获取待预测单词对,以及所述待预测单词对应的类别义原;基于已知的预设义原集合和语义关系集合,和所述待预测单词对应的类别义原,采用预设义原树生成算法为所述待预测单词对预测生成义原树。本发明实施例通过已知的义原知识库,给定单词对的类别义原信息,为给定单词对预测义原树,实现了自动预测义原树,相比人工手动标注义原树需要花费大量的时间和成本,具有更高效和更准确的特点。

    问答推理方法及装置
    88.
    发明公开

    公开(公告)号:CN114817512A

    公开(公告)日:2022-07-29

    申请号:CN202210738644.5

    申请日:2022-06-28

    Applicant: 清华大学

    Abstract: 本发明涉及人工智能技术领域,提供一种问答推理方法及装置,其中方法包括:确定推理目标问题的答案所需的至少一个算子;针对至少一个算子中至少部分需要访问知识库的算子,基于知识库中预先构建的知识元素的倒排索引结构,访问知识库,以得到算子的执行结果;基于至少一个算子的执行结果,得到答案。如此解决现有技术中推理引擎的推理效率不高的缺陷,由于确定的推理目标问题的答案所需的至少一个算子,能够展示出推理目标问题的答案的过程,透明可解释,并且,由于针对至少部分需要访问知识库的算子,基于知识库中预先构建的知识元素的倒排索引结构,访问知识库,以得到算子的执行结果,提高了算子的执行速度,进而提高了答案的推理效率。

    一种旅游知识图谱模型确定方法及装置

    公开(公告)号:CN114036317A

    公开(公告)日:2022-02-11

    申请号:CN202111372439.3

    申请日:2021-11-18

    Applicant: 清华大学

    Abstract: 本发明提供一种旅游知识图谱模型确定方法及装置。其中,该方法包括:从预设的旅游数据源获取相应的旅游知识数据;基于所述旅游知识数据进行概念层建模确定相应的旅游本体;基于所述旅游本体进行实例层建模得到旅游知识图谱模型。本发明提供的旅游知识图谱模型确定方法,能够通过分别构建概念层和实例层来定义面向旅游路径规划的旅游本体和旅游路径实例,丰富旅游知识图谱模型包含内容,以提高查询旅游路径和景点信息的准确度,从而提升用户的使用体验。

    一种事件抽取方法、相关装置、设备及存储介质

    公开(公告)号:CN113761122A

    公开(公告)日:2021-12-07

    申请号:CN202110546916.7

    申请日:2021-05-19

    Abstract: 本申请实施例公开了一种事件抽取方法、相关装置、设备及存储介质,用于将句级自然语言转化为结点和边,再将结点和边转化为语义特征来进行事件抽取,能够保证获取事件的精度。本申请实施例方法包括:获取待处理文本;根据待处理文本生成抽象语义表示,抽象语义表示包括与词语一一对应的结点,以及用于连接结点之间边;对抽象语义和文本表示进行语义编码处理,得到语义嵌入向量,语义嵌入向量用于表示每个词语的与事件之间的语义特征;对抽象语义表示进行图编码处理,得到图嵌入向量,其中,图嵌入向量为用于表示通过边相连接的结点的结构特征;将语义嵌入向量与图嵌入向量进行拼接,得到拼接特征向量;对拼接特征向量进行识别,输出目标事件。

Patent Agency Ranking