-
公开(公告)号:CN114691960A
公开(公告)日:2022-07-01
申请号:CN202210195264.1
申请日:2022-03-01
Applicant: 网易传媒科技(北京)有限公司
IPC: G06F16/951 , G06F16/9535 , G06F40/295
Abstract: 本公开的实施方式提供了一种基于兴趣点的内容召回方法,包括:查找用户对应的第一索引;其中,所述第一索引记录了所述用户对应的兴趣点,以及所述用户与每个兴趣点的第一关联度;所述第一关联度根据逆倾向参数对所述用户与所述每个兴趣点的原始关联度进行调权后确定;查找与所述兴趣点对应的第二索引;所述第二索引记录了所述兴趣点对应的内容,以及所述兴趣点与每个内容的第二关联度;基于第一关联度和第二关联度确定第三关联度;根据所述第三关联度进行排序,确定与所述用户对应的内容召回结果。在以上过程中,一方面,可以降低热度兴趣点的权重,缓解流行度偏差;另一方面,可以进行个性化推荐,有效提高了用户的点击率和浏览时长。
-
公开(公告)号:CN112749946A
公开(公告)日:2021-05-04
申请号:CN202110035092.7
申请日:2021-01-12
Applicant: 网易传媒科技(北京)有限公司
Abstract: 本公开涉及数据处理技术领域,尤其涉及一种word2vec模型训练、数据召回方法及装置,解决对于账户信息利用不充分,导致获取的word2vec模型生成的向量,无法表征账户与账户点击的文章之间的关联性,召回的数据无法满足实际需求的问题,方法为:周期性地根据账户操作的业务数据的项目ID,以及账户ID,生成每一个账户对应的至少一个重构ID序列,对word2vec模型进行训练,并根据模型输出的向量表,确定召回的业务数据,这样,训练样本中充分利用了账户与业务数据之间的交互信息,使得所述word2vec模型充分的学习账户与业务数据之间,以及不同业务数据之间的内在联系,进而能够召回符合账户需要的业务数据。
-
公开(公告)号:CN110442803A
公开(公告)日:2019-11-12
申请号:CN201910738504.6
申请日:2019-08-09
Applicant: 网易传媒科技(北京)有限公司
IPC: G06F16/9536 , G06F16/35 , G06K9/00
Abstract: 本发明的实施方式提供了一种由计算设备执行的数据处理方法,包括:获取原始数据,原始数据包括至少一个文本数据;基于预定规则处理至少一个文本数据中的目标文本数据,得到第一处理结果;以及响应于第一处理结果表征目标文本数据中包括的冗余内容,基于冗余内容更新预定规则。本发明的方法通过使用预定规则识别冗余内容,实现较为准确地识别文章中的冗余内容,提高识别效率,为用户带来了更好的阅读体验。此外,本发明的实施方式提供了一种数据处理装置、一种计算机可读存储介质以及一种计算设备。
-
公开(公告)号:CN110245232A
公开(公告)日:2019-09-17
申请号:CN201910480256.X
申请日:2019-06-03
Applicant: 网易传媒科技(北京)有限公司
IPC: G06F16/35
Abstract: 本发明的实施方式提供了一种文本分类方法。该方法包括:获取待分类文本;根据待分类文本,采用第一深度学习模型获取待分类文本的第一分类信息;在第一分类信息表征待分类文本的类别不是第一类别的情况下,采用第二深度学习模型确定待分类文本的类别。其中,优化得到第二深度学习模型的样本数据包括第一文本,该第一文本的第一分类信息表征的类别不是第一类别。本发明的方法采用两个深度学习模型确定文本分类,其中,第二深度学习模型的样本数据是经由第一深度学习模型召回得到的文本。因此可以提高样本数据中有效样本的浓度,从而减少样本标注,且能够提高分类预测的准确率。此外,本发明的实施方式还提供了一种文本分类装置、介质和计算设备。
-
公开(公告)号:CN114492371B
公开(公告)日:2025-05-02
申请号:CN202210128335.6
申请日:2022-02-11
Applicant: 网易传媒科技(北京)有限公司
IPC: G06F40/194 , G06F40/284
Abstract: 本公开提供了一种文本处理方法及装置、存储介质、电子设备,涉及计算机技术领域。该方法中,可以先从文本库中确定第一文本,再对第一文本进行分词处理,确定第一文本对应的查询词,通过查询词在索引词集中进行查找,确定第一文本对应的备选文本,索引词集是根据文本库中的多个第二文本确定的,并计算第一文本与备选文本之间的相关性得分,最后,根据相关性得分,从备选文本中确定第一文本对应的关联文本,以便基于关联文本建立第一文本的属性图。这样,通过确定文本的查询词与索引词,可以快速确定文本的相关文本,从而可以便于建立文本与相关文本之间的属性图,简化了操作内容,也一定程度上提高了文本处理的效率。
-
公开(公告)号:CN110245232B
公开(公告)日:2022-02-18
申请号:CN201910480256.X
申请日:2019-06-03
Applicant: 网易传媒科技(北京)有限公司
IPC: G06F16/35
Abstract: 本发明的实施方式提供了一种文本分类方法。该方法包括:获取待分类文本;根据待分类文本,采用第一深度学习模型获取待分类文本的第一分类信息;在第一分类信息表征待分类文本的类别不是第一类别的情况下,采用第二深度学习模型确定待分类文本的类别。其中,优化得到第二深度学习模型的样本数据包括第一文本,该第一文本的第一分类信息表征的类别不是第一类别。本发明的方法采用两个深度学习模型确定文本分类,其中,第二深度学习模型的样本数据是经由第一深度学习模型召回得到的文本。因此可以提高样本数据中有效样本的浓度,从而减少样本标注,且能够提高分类预测的准确率。此外,本发明的实施方式还提供了一种文本分类装置、介质和计算设备。
-
公开(公告)号:CN114707036A
公开(公告)日:2022-07-05
申请号:CN202210209754.2
申请日:2022-03-04
Applicant: 网易传媒科技(北京)有限公司
IPC: G06F16/906 , G06F16/9535 , G06F16/958 , G06N3/08 , G06Q30/00 , G06Q30/06
Abstract: 本公开的实施方式提供了一种内容召回方法,包括:获取用户对应的属性信息,以及用户与内容的交互日志;基于所述用户与内容的交互日志,确定所述内容对应的内容特征;基于所述属性信息和所述内容特征,确定所述用户对应的用户特征;通过对所述用户特征和所述内容特征进行相似度计算,确定与所述用户对应的内容召回结果。在以上过程中,通过确定内容特征,捕获内容之间的相似性,再通过属性信息和内容特征相结合的方式,提升了用户特征的丰富性,最后通过用户特征和内容特征的有机结合,打破了原本仅依赖于用户交互进行召回的局限性,从内容相似性和用户交互两个维度提升了召回内容的丰富度,从而提高了用户点击率和浏览时长。
-
公开(公告)号:CN114492371A
公开(公告)日:2022-05-13
申请号:CN202210128335.6
申请日:2022-02-11
Applicant: 网易传媒科技(北京)有限公司
IPC: G06F40/194 , G06F40/284
Abstract: 本公开提供了一种文本处理方法及装置、存储介质、电子设备,涉及计算机技术领域。该方法中,可以先从文本库中确定第一文本,再对第一文本进行分词处理,确定第一文本对应的查询词,通过查询词在索引词集中进行查找,确定第一文本对应的备选文本,索引词集是根据文本库中的多个第二文本确定的,并计算第一文本与备选文本之间的相关性得分,最后,根据相关性得分,从备选文本中确定第一文本对应的关联文本,以便基于关联文本建立第一文本的属性图。这样,通过确定文本的查询词与索引词,可以快速确定文本的相关文本,从而可以便于建立文本与相关文本之间的属性图,简化了操作内容,也一定程度上提高了文本处理的效率。
-
公开(公告)号:CN114491262A
公开(公告)日:2022-05-13
申请号:CN202210101271.0
申请日:2022-01-27
Applicant: 网易传媒科技(北京)有限公司
IPC: G06F16/9535 , G06F16/9536
Abstract: 本公开的实施方式提供了一种内容召回方法、装置、电子设备及计算机可读存储介质。所述方法包括:获得与用户的各个类型的内容偏好分别对应的各个内容集合;针对所述各个内容集合,分别召回为所述用户推荐的内容,以获得与所述用户的各个类型的内容偏好分别对应的各个召回结果;根据与所述用户的各个类型的内容偏好分别对应的各个召回结果,获得与所述用户对应的召回结果。
-
公开(公告)号:CN112749946B
公开(公告)日:2024-05-14
申请号:CN202110035092.7
申请日:2021-01-12
Applicant: 网易传媒科技(北京)有限公司
IPC: G06Q10/10 , G06Q30/014 , G06N3/08
Abstract: 本公开涉及数据处理技术领域,尤其涉及一种word2vec模型训练、数据召回方法及装置,解决对于账户信息利用不充分,导致获取的word2vec模型生成的向量,无法表征账户与账户点击的文章之间的关联性,召回的数据无法满足实际需求的问题,方法为:周期性地根据账户操作的业务数据的项目ID,以及账户ID,生成每一个账户对应的至少一个重构ID序列,对word2vec模型进行训练,并根据模型输出的向量表,确定召回的业务数据,这样,训练样本中充分利用了账户与业务数据之间的交互信息,使得所述word2vec模型充分的学习账户与业务数据之间,以及不同业务数据之间的内在联系,进而能够召回符合账户需要的业务数据。
-
-
-
-
-
-
-
-
-