-
公开(公告)号:CN111625715A
公开(公告)日:2020-09-04
申请号:CN202010388074.2
申请日:2020-05-09
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/9535 , G06N3/04 , G06N3/08
Abstract: 本公开是关于一种信息提取方法、装置、电子设备及存储介质,涉及信息处理技术领域,用以解决相关技术中对象元信息较为复杂,缺乏针对性,无法准确高效应用的问题,本公开方法包括:获取目标对象对应的标签集合以及目标账户的账户信息,其中标签集合包括至少两个用于描述对象的标签;基于预设映射方式,获取根据账户信息映射得到的注意力特征,其中注意力特征包含标签集合中各个标签对应的权重,预设映射方式是根据样本账户对应的样本对象的历史行为确定的;根据注意力特征以及标签集合,确定目标账户对应的目标对象元信息。由于本公开实施例可以得到与用户关联的注意力特征,可以表示出用户对标签集合中各个标签的关注度,针对性地刻画目标对象。
-
公开(公告)号:CN111611490A
公开(公告)日:2020-09-01
申请号:CN202010448846.7
申请日:2020-05-25
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/9535
Abstract: 本申请提供了一种资源搜索方法、装置、设备及存储介质,属于计算机技术领域。本申请提供了一种基于用户的历史点击行为搜索资源的方法,通过考虑到用户的历史兴趣,根据候选资源与用户历史点击过的资源之间的相似度,对候选资源的资源特征进行加权,以使得到的目标特征不仅蕴含候选资源本身的特征,还融合了用户对资源的偏好,那么由于目标特征的表达能力更强,因此利用目标特征能够更精准地预估出目标参数,由于利用了更加准确的目标参数确定搜索结果,从而显著提高了搜索结果的准确性。
-
公开(公告)号:CN111597444A
公开(公告)日:2020-08-28
申请号:CN202010404521.9
申请日:2020-05-13
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/9535 , G06F16/9538
Abstract: 本公开关于一种搜索方法、装置、服务器、存储介质。该搜索方法包括:根据终端的搜索词获取搜索结果,其中,搜索结果中包括多条待排序信息;将包括多条待排序信息的搜索结果作为树模型的输入,并利用树模型对各待排序信息进行排序,其中,树模型为预先使用数据集训练得到,数据集中的特征矩阵通过用户信息所生成,并且特征矩阵中的缺失数据利用缺失数据填补模型进行填充;将利用树模型排序后的搜索结果发送至终端。相对于现有技术直接使用预设的缺省值进行填充的方式,由于利用了缺失数据填补模型的良好预测性能,因此填充结果与真实值之间的差距相对较小,这样所训练出的树模型在用于对搜索结果进行排序时,能够使得排序结果更加符合用户需求。
-
公开(公告)号:CN111444687A
公开(公告)日:2020-07-24
申请号:CN202010203166.9
申请日:2020-03-20
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F40/169
Abstract: 本申请实施例公开了一种标签生成方法、装置、服务器及存储介质,用于生成多媒体数据的作品标签。该方法可以包括:服务器获取用户上传的第一多媒体数据和与第一多媒体数据对应的第一文本信息,根据第一文本信息生成至少一个文字标签,通过文字标签和预先生成的多个第一用户标签,生成与第一多媒体数据对应的作品标签。通过第一用户标签和多媒体数据中的文本信息,生成与多媒体数据对应的作品标签,可以准确的描述用户上传的多媒体数据,同时可以避免使用深度学习生成作品标签时,耗费的计算资源较多,耗时较长,难以满足实时性需求的问题。
-
公开(公告)号:CN111368138A
公开(公告)日:2020-07-03
申请号:CN202010085380.9
申请日:2020-02-10
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开是关于一种视频类别标签的排序方法、装置、电子设备及存储介质,该方法包括:获取视频,以及确定该视频中的目标图像;利用多个不同的模型基于视频中的目标图像,生成视频的多个标签;基于视频的多个标签中的每一个标签的与排序相关的信息,计算视频的每一个标签各自对应的用于排序的权重;根据视频的每一个标签各自对应的用于排序的权重,对视频的多个标签进行排序,得到视频的多个标签的排序结果。实现了在对视频的多个标签进行排序时,同时考虑了标签与视频的内容的关联性、标签自身的置信度等因素,基于标签的关联度信息、标签的置信度信息等与排序相关的信息,对视频的多个标签进行排序,得到视频的多个标签的排序结果。从而,提升视频的多个标签的排序结果的准确性。
-
公开(公告)号:CN111324755A
公开(公告)日:2020-06-23
申请号:CN202010112968.9
申请日:2020-02-24
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/45 , G06F16/483 , G06K9/62
Abstract: 本公开关于一种标签确定方法、装置、电子设备及存储介质。该标签确定方法包括:获取用户账号对应的第一作品集,以及提取第一作品集中的第一作品的平均特征;其中,第一作品集中的第一作品为用户账号对应的代表作品;获取目标作品,并提取目标作品的特征;计算目标作品的特征与平均特征之间的特征差值;获取用户账号对应的用户画像标签,将用户画像标签确定为特征差值小于预设阈值的目标作品的标签。根据本公开的实施例,当特征差值小于预设阈值时,将用户账号对应的用户画像标签,确定为相应目标作品的标签,可以避免直接将用户画像标签确定为目标作品的标签造成的目标作品与标签不适用的现象,保证目标作品的内容与对应的标签的一致性。
-
公开(公告)号:CN109359592B
公开(公告)日:2019-12-06
申请号:CN201811204526.6
申请日:2018-10-16
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本申请提供了一种视频帧的处理方法、装置、电子设备及存储介质,包括:获取视频样本的多个关键帧图像;分别提取每个关键帧图像的图像特征,得到多个第一图像特征;将多个第一图像特征导入注意力机制模型,输出基于图像通道的注意力的多个第二图像特征;将多个第二图像特征进行特征融合,得到融合特征。本申请基于注意力机制,捕捉视频样本中多个关键帧图像之间基于图像通道的关联性,并通过特征融合操作得到融合特征,使得融合特征包括了关键帧之间的关联性,提高了特征的精度,另外,特征融合操作没有对关键帧帧数的限定,因此可以实现对不同时长视频的处理,降低了对不定时长的视频进行特征提取的操作繁琐程度。
-
公开(公告)号:CN108664989B
公开(公告)日:2019-11-01
申请号:CN201810260522.3
申请日:2018-03-27
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本发明实施例提供了一种图像标签确定方法、装置及终端,其中所述方法包括:将图像输入卷积神经网络中,确定所述图像的特征图;将所述特征图输入分类器中;其中,所述分类器中包含多个分类任务,每个分类任务为多标签分类任务或单标签分类任务;通过所述分类器中的各分类任务,分别预测所述特征图对应的标签;其中,每个标签对应一个概率值;依据概率值从预测得到的各标签中筛选所述图像的标签。本发明提供的图像标签确定方法,能够根据图像类型适应性调整图像分类方式,灵活性强且能够提升标签预测结果的准确性。
-
公开(公告)号:CN108549627B
公开(公告)日:2019-10-01
申请号:CN201810191423.4
申请日:2018-03-08
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F17/27 , G06F16/901
Abstract: 本发明实施例提供了一种汉字处理方法及装置。获取待处理汉字包括的至少一个元素,该元素包括待处理汉字的汉语拼音的声调、该汉语拼音包括的声母、该汉语拼音包括的韵母以及组成待处理汉字的笔画;确定每一个元素在预设元素总集合中的索引位置;统计每一个元素在待处理汉字中的出现次数;根据该索引位置和该出现次数生成待处理汉字的拼音哈希向量;利用预设嵌入神经网络处理拼音哈希向量,即可以得到待处理汉字的连续特征。本发明对于未出现在预设字典中的汉字具有良好的鲁棒性,此外,由于拼音哈希空间大小恒定,因此即便预设字典中新增汉字,也不会影响所构建的拼音哈希空间的整体构造,只需添加新增汉字对应的元素即可,可扩展性强。
-
公开(公告)号:CN110175653A
公开(公告)日:2019-08-27
申请号:CN201910459369.1
申请日:2019-05-29
Applicant: 北京达佳互联信息技术有限公司
IPC: G06K9/62
Abstract: 本公开是关于一种图像识别的方法、装置、设备及存储介质,方法包括:获取识别模型,基于识别模型对目标训练数据集中的训练数据进行识别,得到每一个训练数据的识别结果,将识别结果作为训练数据的标签;在目标训练数据集中,获取满足目标条件的训练数据;基于满足目标条件的训练数据训练识别模型,得到更新后的识别模型;基于更新后的识别模型对目标训练数据集中的训练数据进行识别,得到每一个训练数据的识别结果;根据识别结果更新训练数据的标签,得到更新后的目标训练数据集,将更新后的目标训练数据集中的训练数据作为用于训练机器学习模型的训练数据,利用基于目标训练数据集中的训练数据训练得到的目标识别物的识别模型进行图像识别。
-
-
-
-
-
-
-
-
-