建立适合于跨语言序列标记任务的语言模型

    公开(公告)号:CN116976340A

    公开(公告)日:2023-10-31

    申请号:CN202210434197.4

    申请日:2022-04-24

    Abstract: 本公开提供了用于建立适合于跨语言序列标记任务的语言模型的方法、装置、计算机程序产品和计算机可读介质。可以获得包括采用第一语言的第一语句和采用第二语言的第二语句的训练语句对,所述第二语句是所述第一语句在所述第二语言中的版本。可以利用至少一个预定义词条来屏蔽所述第一语句中的至少一个原始片段,以获得经屏蔽的第一语句。可以至少利用所述经屏蔽的第一语句和所述第二语句来形成所述语言模型的输入序列。可以通过所述语言模型生成所述输入序列的输入序列表示。可以至少基于所述输入序列表示来执行目标片段预测,以预测所述第二语句中的至少一个目标片段的起始位置和结束位置,所述至少一个目标片段分别对应于所述至少一个预定义词条。可以至少基于所述目标片段预测来优化所述语言模型。

    基于图增强协同过滤的内容推荐
    14.
    发明公开

    公开(公告)号:CN116340645A

    公开(公告)日:2023-06-27

    申请号:CN202111587928.0

    申请日:2021-12-23

    Abstract: 本公开提出了用于基于图增强协同过滤的内容推荐的方法、装置和计算机程序产品。可以生成候选内容项的候选内容项表示。可以生成与目标用户的一组历史内容项相对应的一组历史内容项表示。可以基于一组元兴趣来生成针对全体用户的一组总体兴趣表示,每个元兴趣表征一个兴趣元素。可以基于所述一组历史内容项表示和所述一组总体兴趣表示来生成所述目标用户的用户兴趣表示。可以基于所述候选内容项表示和所述用户兴趣表示来预测所述目标用户点击所述候选内容项的点击概率。

    确定目标实体的代表性事实
    19.
    发明公开

    公开(公告)号:CN116089839A

    公开(公告)日:2023-05-09

    申请号:CN202111269134.X

    申请日:2021-10-29

    Abstract: 本公开提供了用于确定目标实体的代表性事实的方法和装置。可以生成在与所述目标实体相关联的多个事实中的任意两个事实之间的相似度分数。可以利用所述多个事实中的事实之间的相似度分数来构建图,所述图中的每个节点对应于所述多个事实中的一个事实。可以通过提取所述图中的多个连通子图来获得多个事实聚类。可以从所述多个事实聚类中选择预定数量的代表性事实。

    根据查询的问题生成
    20.
    发明公开

    公开(公告)号:CN115599904A

    公开(公告)日:2023-01-13

    申请号:CN202110771263.2

    申请日:2021-07-08

    Abstract: 本公开提出了用于根据查询的问题生成的方法、装置和计算机程序产品。可以获得与搜索引擎相关联的搜索日志。可以从所述搜索日志中提取多个搜索查询和与所述多个搜索查询相对应的多个搜索结果集合。可以通过所述多个搜索查询和所述多个搜索结果集合来获得至少用于训练问题生成模型的训练数据集合,所述训练数据集合中的每个样本包括搜索查询和搜索结果的标题,所述标题是与所述搜索查询相对应的问题。

Patent Agency Ranking