一种扩充慕课课程概念的方法及系统

    公开(公告)号:CN112734608A

    公开(公告)日:2021-04-30

    申请号:CN202011583108.X

    申请日:2020-12-28

    Applicant: 清华大学

    Abstract: 本发明实施例提供一种扩充慕课课程概念的方法及系统,该方法包括:将在线的交互式游戏作为训练环境,训练得到强化学习模型;基于课内概念集合和所述强化学习模型进行概念扩展,并在扩展过程中获取用户反馈,所述课内概念集合是由慕课课程中需补充讲解的课程知识点内容构成的;将所述用户反馈返回所述交互式游戏中重新进行扩展,直至达到预设目标,得到扩展结果。本发明实施例通过使用强化学习的训练方法,可以在某些特定课程上进行训练后大规模应用于新设立的课程,相比传统的方法节省了大量人工标注,因此具有较强的延展性。同时,并且由于多层次的训练模式,可以在处理涉及多学科的领域的课程时,保持产生较高质量的扩展结果。

    商品分类方法、装置、存储介质及电子设备

    公开(公告)号:CN114661895A

    公开(公告)日:2022-06-24

    申请号:CN202011540233.2

    申请日:2020-12-23

    Abstract: 本公开涉及一种商品分类方法、装置、存储介质及电子设备。该方法包括:获取目标商品的商品信息,商品信息包括从多个数据来源获取到的信息;按照预设数据类型从商品信息中确定各数据类型分别对应的商品子信息;将所有商品子信息输入商品多分类模型,得到商品多分类模型输出的与目标商品对应的分类标签集合;商品多分类模型包括对应不同数据类型的特征表示模块,商品多分类模型用于针对每一商品子信息,将该商品子信息输入与该商品子信息的数据类型对应的特征表示模块得到该商品子信息的特征向量;将各数据类型的商品子信息的特征向量进行拼接得到目标商品的商品向量;将商品向量输入商品多分类模型中的分类模块,得到分类模块输出的分类标签集合。

    利用无标签文本数据样本提升分类模型表现的方法和装置

    公开(公告)号:CN113806535B

    公开(公告)日:2024-09-06

    申请号:CN202111045781.2

    申请日:2021-09-07

    Applicant: 清华大学

    Inventor: 唐杰 罗干

    Abstract: 本申请提出了一种利用无标签文本数据样本提升分类模型表现的方法,该方法包括:获取有标签样本集合、无标签样本集合、分类任务的分类类型集合、验证集和监督学习模型;对监督学习模型进行参数初始化,确定第一扰动概率和第二扰动概率;使用有标签样本集合、无标签样本集合对监督学习模型进行重复训练,并在每一次训练后对监督学习模型在验证集上评估表现,若评价指标表现更好时,记录当时的模型参数,当重复训练达到预设条件时,训练停止,输出最终训练完成的模型。采用上述方案的本申请能够通过文本字符和模型随机化结构来添加随机扰动,使得无标签样本同时参与训练,提升了分类模型的表现。

    利用无标签文本数据样本提升分类模型表现的方法和装置

    公开(公告)号:CN113806535A

    公开(公告)日:2021-12-17

    申请号:CN202111045781.2

    申请日:2021-09-07

    Applicant: 清华大学

    Inventor: 唐杰 罗干

    Abstract: 本申请提出了一种利用无标签文本数据样本提升分类模型表现的方法,该方法包括:获取有标签样本集合、无标签样本集合、分类任务的分类类型集合、验证集和监督学习模型;对监督学习模型进行参数初始化,确定第一扰动概率和第二扰动概率;使用有标签样本集合、无标签样本集合对监督学习模型进行重复训练,并在每一次训练后对监督学习模型在验证集上评估表现,若评价指标表现更好时,记录当时的模型参数,当重复训练达到预设条件时,训练停止,输出最终训练完成的模型。采用上述方案的本申请能够通过文本字符和模型随机化结构来添加随机扰动,使得无标签样本同时参与训练,提升了分类模型的表现。

Patent Agency Ranking