用于知识蒸馏的模型选择学习

    公开(公告)号:CN113822434A

    公开(公告)日:2021-12-21

    申请号:CN202010561319.7

    申请日:2020-06-18

    Abstract: 本公开提供了用于基于知识蒸馏来获得目标模型的方法和装置。可以获得数据集合和一组候选参考模型。可以针对所述数据集合中的每个训练样本,确定从所述一组候选参考模型中选择出的一组选定参考模型。可以获取所述一组选定参考模型针对所述训练样本输出的一组目标概率分布。可以利用所述一组目标概率分布来训练所述目标模型。

    用于问题回答(QA)的对仗学习
    23.
    发明公开

    公开(公告)号:CN113139119A

    公开(公告)日:2021-07-20

    申请号:CN202010064971.8

    申请日:2020-01-20

    Abstract: 本公开涉及用于问题回答(QA)的对仗学习,并且提出了用于提供对仗训练数据的方法和装置。可以从训练数据集中获得一个正例,所述正例包括被标记为相关的第一文本和第二文本。可以从搜索日志中提取对仗信息。可以至少基于所述对仗信息来修改所述第一文本。可以将经修改的第一文本和所述第二文本组合成与所述正例对仗的反例,所述经修改的第一文本和所述第二文本在所述反例中被标记为不相关。

    基于隐式相关性反馈来提供QA训练数据以及训练QA模型

    公开(公告)号:CN113127614A

    公开(公告)日:2021-07-16

    申请号:CN202010046175.1

    申请日:2020-01-16

    Abstract: 本公开提供了用于基于隐式相关性反馈来提供QA训练数据以及训练QA模型的方法和装置。可以从搜索日志中获得问题‑文段对以及对应的用户行为。可以从所述用户行为中提取行为特征。可以通过隐式相关性反馈模型,基于所述行为特征来确定所述问题与所述文段之间的相关性分数。可以基于所述相关性分数,向所述问题‑文段对添加相关性标记。可以利用所获得的自动标记的QA训练数据来对QA模型进行预训练,并且利用人为标记的QA训练数据来对经预训练的QA模型进行精调。

    基于跨域行为数据的序列推荐
    27.
    发明公开

    公开(公告)号:CN118733867A

    公开(公告)日:2024-10-01

    申请号:CN202310332238.3

    申请日:2023-03-30

    Abstract: 本公开提出了用于基于跨域行为数据的序列推荐的方法、装置和计算机可读介质。可以基于目标用户的历史内容项序列,生成所述目标用户的目标用户表示。可以从网络应用的日志中提取跨域行为序列集合。可以生成与所述跨域行为序列集合相对应的跨域序列表示集合。可以从所述跨域序列表示集合中检索与所述目标用户表示相似的相似序列表示集合。可以基于所述目标用户表示和所述相似序列表示集合,预测所述目标用户与候选内容项集合交互的交互概率集合。

    网页中的列表提取和可视化
    30.
    发明公开

    公开(公告)号:CN116484126A

    公开(公告)日:2023-07-25

    申请号:CN202210040984.0

    申请日:2022-01-14

    Abstract: 本公开提供了用于网页中的列表提取和可视化的方法、装置和计算机程序产品。可以检测目标网页中的至少一个锚点元素组,所述至少一个锚点元素组包括第一锚点元素组。可以对所述第一锚点元素组中的多个锚点元素执行边界检测,以获得与所述多个锚点元素分别关联的多个项目的边界,所述多个项目对应于所述目标网页中的第一原始列表。可以利用所述多个项目的边界,从所述目标网页中获得与所述多个项目分别对应的多组代表性元数据。可以将所述多组代表性元数据可视化为结构化列表。

Patent Agency Ranking