-
公开(公告)号:CN108595497A
公开(公告)日:2018-09-28
申请号:CN201810220055.1
申请日:2018-03-16
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本发明实施例提供了一种数据筛选方法、装置及终端,其中,所述数据筛选方法包括:从待筛选数据中提取多个噪声数据作为样本数据;对各所述样本数据进行变换处理,得到各所述样本数据的变换数据;通过预先训练好的图像分类模型,对各所述样本数据及各所述变换数据进行标签预测,确定各所述样本数据的目标标签和目标标签概率;根据各所述样本数据的目标标签及目标标签概率,对各所述样本数据进行筛选,获得目标数据库本发明实施例提供的数据筛选方案,无需用户手动对待筛选数据逐一进行标记筛选,可依据计算机程序自动进行数据筛选,操作便捷且耗时短,既能够节省人力资源,又能够提升数据筛选效率。
-
公开(公告)号:CN108549627A
公开(公告)日:2018-09-18
申请号:CN201810191423.4
申请日:2018-03-08
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本发明实施例提供了一种汉字处理方法及装置。获取待处理汉字包括的至少一个元素,该元素包括待处理汉字的汉语拼音的声调、该汉语拼音包括的声母、该汉语拼音包括的韵母以及组成待处理汉字的笔画;确定每一个元素在预设元素总集合中的索引位置;统计每一个元素在待处理汉字中的出现次数;根据该索引位置和该出现次数生成待处理汉字的拼音哈希向量;利用预设嵌入神经网络处理拼音哈希向量,即可以得到待处理汉字的连续特征。本发明对于未出现在预设字典中的汉字具有良好的鲁棒性,此外,由于拼音哈希空间大小恒定,因此即便预设字典中新增汉字,也不会影响所构建的拼音哈希空间的整体构造,只需添加新增汉字对应的元素即可,可扩展性强。
-
公开(公告)号:CN108399409A
公开(公告)日:2018-08-14
申请号:CN201810055063.5
申请日:2018-01-19
Applicant: 北京达佳互联信息技术有限公司
CPC classification number: G06K9/342 , G06K9/6256 , G06K9/6267
Abstract: 本发明实施例提供了一种图像分类方法、装置及终端,其中所述方法包括:通过卷积神经网络确定图像对应的图像特征向量;其中,所述图像对应有文字描述信息;通过嵌入网络对所述文字描述信息进行处理,得到文字特征向量;将所述图像特征向量和文字特征向量拼接,得到图文特征向量;调用深度神经网络,根据所述深度神经网络依据所述图像特征向量、文字特征向量以及所述图文特征向量,确定所述图像对应的分类。通过本发明实施例提供的图像分类方法,能够提升图像分类的准确性。
-
公开(公告)号:CN108304459A
公开(公告)日:2018-07-20
申请号:CN201711409084.4
申请日:2017-12-22
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F17/30
CPC classification number: G06F17/30058
Abstract: 本发明提供了一种多媒体文件的预测方法和装置,其中,所述方法包括:对目标多媒体文件集分别通过语音识别算法、图像识别算法及自然语言处理算法,识别得到三个标签集;根据三个标签集,将目标多媒体文件集中的各目标多媒体文件划分至预设主题集的各主题中,并统计各目标多媒体文件在各主题中的分布概率;根据各目标多媒体文件在各主题中的分布概率及各主题中目标主题对应的条件分布概率,预测各目标多媒体文件的得分;按照得分对各目标多媒体文件进行排序。从而可以解决单独采用语音识别算法、图像识别算法或自然语言处理算法进行内容识别,准确性较差的问题,取得了提高多媒体文件内容识别的准确性的有益效果。
-
公开(公告)号:CN107679513A
公开(公告)日:2018-02-09
申请号:CN201710984142.X
申请日:2017-10-20
Applicant: 北京达佳互联信息技术有限公司
CPC classification number: G06K9/00268 , G06K9/00288 , G06K2009/00322 , G06N3/0454 , G06N3/084
Abstract: 本发明实施例公开了图像处理方法、装置及服务器,包括下述步骤:获取待处理的人脸图像;将所述人脸图像输入到构建有损失函数的卷积神经网络模型中,所述损失函数根据预设期望指向性的筛选增大图像分类后的类间距离;获取所述卷积神经网络模型输出的分类数据,并根据所述分类数据对所述人脸图像进行内容理解。通过在卷积神经网络模型上构建新的损失函数,该损失函数具有晒选增大图像分类后类间距的作用,通过该损失函数训练得到的卷积神经网络模型,输出的分类数据的类间距离增大,使图像识别过程中类间距离增大,图像之间差别的显著性明显提高,致使图像比对时准确性明显的提高,应用该图像处理方法的安全性也得到了有效地保障。
-
公开(公告)号:CN114528435B
公开(公告)日:2024-12-10
申请号:CN202011321732.2
申请日:2020-11-23
Applicant: 北京达佳互联信息技术有限公司
Inventor: 张志伟
IPC: G06F16/738 , G06F16/78
Abstract: 本公开关于一种搜索场景下的视频排序方法、装置、电子设备及存储介质。该搜索场景下的视频排序方法包括:获取目标视频集,以及获取目标视频集中的目标视频对应的目标播放特征;将目标视频对应的目标播放特征输入预设的视频排序模型,并输出目标视频集中的目标视频的排序结果;其中,视频排序模型为根据历史视频集中的历史视频对应的历史播放特征,对模型训练中的损失函数进行调整后训练得到的;按照排序结果,对目标视频集中的目标视频进行展示。该搜索场景下的视频排序方法,根据历史视频特征,对模型训练中的损失函数进行调整,使训练得到的视频排序模型能够充分兼顾视频样本之间的差异性,提高视频排序和展示结果的准确性。
-
公开(公告)号:CN112364184B
公开(公告)日:2024-04-30
申请号:CN202011264599.1
申请日:2020-11-12
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/435 , G06F16/438 , G06F16/48 , G06F18/25 , G06F18/213 , G06N3/045 , G06N3/08
Abstract: 本公开关于一种多媒体数据的排序方法、装置、服务器及存储介质,属于计算机技术领域。本公开提供的方案,通过在接收到目标账号的搜索请求时,确定在目标账号要搜索的搜索关键词下,多个多媒体数据发生互动操作的概率,进而结合多个多媒体数据的相关性特征和质量特征,对这多个多媒体数据进行排序,由于相关性特征能够表示多媒体数据和搜索关键词的匹配程度,质量特征能够表示多媒体数据的内容质量,从而使得排序靠前的多媒体数据是与搜索关键词相关且质量较高的数据,提高了多媒体数据的排序准确性。
-
公开(公告)号:CN111581481B
公开(公告)日:2024-03-08
申请号:CN202010402130.3
申请日:2020-05-13
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/951
-
公开(公告)号:CN112364185B
公开(公告)日:2024-02-06
申请号:CN202011322352.0
申请日:2020-11-23
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/435 , G06F16/48
Abstract: 本公开提供多媒体资源的特征确定方法、装置、电子设备和存储介质,包括:获取目标多媒体资源的期望排序区间以及提取各特征类别分别对应的第一特征值;所述目标多媒体资源为推荐排序错误的多媒体资源;依据期望排序区间,在特征类别集中查找满足筛选条件的候选特征类别,从候选特征类别的值域中选取n个不同于候选特征类别的第一特征值的候选特征值,并分别采用候选特征值对第一特征值进行替换,得到n个新的特征类别集;采用n个新的特征类别集,重新对目标多媒体资源进行排序处理,得到与每个新的特征类别集对应的排序值;若存在至少一个排序值在期望排序区间内,则确定候选特征类别为寻找的目标特征类别并输出。故此,节省了大量的时间和人力。
-
公开(公告)号:CN113420056B
公开(公告)日:2023-12-26
申请号:CN202110529224.1
申请日:2021-05-14
Applicant: 北京达佳互联信息技术有限公司
Inventor: 张志伟
IPC: G06F16/2457 , G06F18/22 , G06F18/214
Abstract: 本公开关于一种行为数据处理方法、装置、电子设备及存储介质,该行为数据处理方法包括:获取目标搜索信息对应的至少一个搜索结果;确定所述目标搜索信息和所述至少一个搜索结果之间的相似度;确定所述至少一个搜索结果对应的对象行为数据;基于所述目标搜索信息和所述至少一个搜索结果之间的相似度,对所述至少一个搜索结果对应的对象行为数据进行修正,得到所述至少一个搜索结果对应的目标对象行为数据。利用本公开实施例提供的技术方案能够降低通过该目标对象行为数据刻画用户的偏好程度时存在的偏差。
-
-
-
-
-
-
-
-
-