-
公开(公告)号:CN112734608A
公开(公告)日:2021-04-30
申请号:CN202011583108.X
申请日:2020-12-28
Applicant: 清华大学
Abstract: 本发明实施例提供一种扩充慕课课程概念的方法及系统,该方法包括:将在线的交互式游戏作为训练环境,训练得到强化学习模型;基于课内概念集合和所述强化学习模型进行概念扩展,并在扩展过程中获取用户反馈,所述课内概念集合是由慕课课程中需补充讲解的课程知识点内容构成的;将所述用户反馈返回所述交互式游戏中重新进行扩展,直至达到预设目标,得到扩展结果。本发明实施例通过使用强化学习的训练方法,可以在某些特定课程上进行训练后大规模应用于新设立的课程,相比传统的方法节省了大量人工标注,因此具有较强的延展性。同时,并且由于多层次的训练模式,可以在处理涉及多学科的领域的课程时,保持产生较高质量的扩展结果。
-
公开(公告)号:CN114661895A
公开(公告)日:2022-06-24
申请号:CN202011540233.2
申请日:2020-12-23
Applicant: 北京三快在线科技有限公司 , 清华大学
Abstract: 本公开涉及一种商品分类方法、装置、存储介质及电子设备。该方法包括:获取目标商品的商品信息,商品信息包括从多个数据来源获取到的信息;按照预设数据类型从商品信息中确定各数据类型分别对应的商品子信息;将所有商品子信息输入商品多分类模型,得到商品多分类模型输出的与目标商品对应的分类标签集合;商品多分类模型包括对应不同数据类型的特征表示模块,商品多分类模型用于针对每一商品子信息,将该商品子信息输入与该商品子信息的数据类型对应的特征表示模块得到该商品子信息的特征向量;将各数据类型的商品子信息的特征向量进行拼接得到目标商品的商品向量;将商品向量输入商品多分类模型中的分类模块,得到分类模块输出的分类标签集合。
-
公开(公告)号:CN113806535B
公开(公告)日:2024-09-06
申请号:CN202111045781.2
申请日:2021-09-07
Applicant: 清华大学
IPC: G06F16/35 , G06F40/216 , G06N3/047 , G06N3/084 , G06N3/09
Abstract: 本申请提出了一种利用无标签文本数据样本提升分类模型表现的方法,该方法包括:获取有标签样本集合、无标签样本集合、分类任务的分类类型集合、验证集和监督学习模型;对监督学习模型进行参数初始化,确定第一扰动概率和第二扰动概率;使用有标签样本集合、无标签样本集合对监督学习模型进行重复训练,并在每一次训练后对监督学习模型在验证集上评估表现,若评价指标表现更好时,记录当时的模型参数,当重复训练达到预设条件时,训练停止,输出最终训练完成的模型。采用上述方案的本申请能够通过文本字符和模型随机化结构来添加随机扰动,使得无标签样本同时参与训练,提升了分类模型的表现。
-
公开(公告)号:CN110909175B
公开(公告)日:2021-06-29
申请号:CN201911140653.9
申请日:2019-11-20
Applicant: 清华大学
IPC: G06F16/36 , G06F16/35 , G06F40/284 , G06F40/289 , G06Q50/20
Abstract: 本发明提出一种基于搜索引擎的在线课程概念知识图谱构建方法,属于信息技术领域。该方法使用外部数据库和自然语言处理的方法,获取了课程文本中的概念,由此得到课程领域分类的结果,同时利用搜索引擎获取概念的搜索结果,提取其中的课程扩展概念,完成概念知识图谱的构建。本发明无需训练数据,可在课程文本这一特殊场景中获取准确且全面的概念,有效构建在线课程概念知识图谱。
-
公开(公告)号:CN118020097A
公开(公告)日:2024-05-10
申请号:CN202180101578.4
申请日:2021-08-11
Applicant: 罗伯特·博世有限公司 , 清华大学
IPC: G09B5/00
Abstract: 提供了一种用于使神经网络系统能够发现多个课程的概念之间的先决条件关系的方法,其中,多个课程中的每个课程包含一系列视频。该方法包括:收集学生行为数据,学生行为数据至少包括跨多个课程的视频观看行为数据;至少基于视频观看行为模式将学生行为数据建模为先决条件特征,其中,视频观看行为模式由来自视频观看行为数据的一个或多个视频对形成;以及至少基于先决条件特征来训练神经网络系统。提供了众多其它方面。
-
公开(公告)号:CN113806535A
公开(公告)日:2021-12-17
申请号:CN202111045781.2
申请日:2021-09-07
Applicant: 清华大学
IPC: G06F16/35 , G06F40/216 , G06N3/04 , G06N3/08
Abstract: 本申请提出了一种利用无标签文本数据样本提升分类模型表现的方法,该方法包括:获取有标签样本集合、无标签样本集合、分类任务的分类类型集合、验证集和监督学习模型;对监督学习模型进行参数初始化,确定第一扰动概率和第二扰动概率;使用有标签样本集合、无标签样本集合对监督学习模型进行重复训练,并在每一次训练后对监督学习模型在验证集上评估表现,若评价指标表现更好时,记录当时的模型参数,当重复训练达到预设条件时,训练停止,输出最终训练完成的模型。采用上述方案的本申请能够通过文本字符和模型随机化结构来添加随机扰动,使得无标签样本同时参与训练,提升了分类模型的表现。
-
公开(公告)号:CN110909175A
公开(公告)日:2020-03-24
申请号:CN201911140653.9
申请日:2019-11-20
Applicant: 清华大学
IPC: G06F16/36 , G06F16/35 , G06F40/284 , G06F40/289 , G06Q50/20
Abstract: 本发明提出一种基于搜索引擎的在线课程概念知识图谱构建方法,属于信息技术领域。该方法使用外部数据库和自然语言处理的方法,获取了课程文本中的概念,由此得到课程领域分类的结果,同时利用搜索引擎获取概念的搜索结果,提取其中的课程扩展概念,完成概念知识图谱的构建。本发明无需训练数据,可在课程文本这一特殊场景中获取准确且全面的概念,有效构建在线课程概念知识图谱。
-
-
-
-
-
-