-
公开(公告)号:CN115393849A
公开(公告)日:2022-11-25
申请号:CN202210901461.0
申请日:2022-07-28
Applicant: 北京达佳互联信息技术有限公司 , 北京中科研究院
Abstract: 本公开关于一种数据处理方法、装置、电子设备及存储介质,该方法包括:获取待处理业务图像以及其关联的业务文本;基于提取的待处理业务图像的视觉特征得到视觉提示向量;对视觉提示向量和业务文本进行编码处理得到编码向量;该编码向量包括对应视觉提示向量的视觉编码向量和对应业务文本的文本编码向量;基于所述视觉编码向量和所述文本编码向量中各所述命名实体对应的实体编码向量,确定实体提示向量;基于所述视觉提示向量和所述实体提示向量对所述编码向量进行解码处理,得到所述待处理业务图像对应的描述文本。本公开提高了生成描述文本中命名实体的准确性。
-
公开(公告)号:CN113918822B
公开(公告)日:2025-01-10
申请号:CN202111272983.0
申请日:2021-10-29
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/9535 , G06F16/9538 , G06F18/23213 , G06N20/00
Abstract: 本公开关于一种内容搜索方法、装置、电子设备及存储介质,涉及数据处理技术领域。该方法包括:获取搜索词,并确定搜索词对应的多个搜索结果;读取预先存储的搜索词与至少两种类型的搜索结果之间的对应关系;对应关系是根据搜索词对应的用户满意值和被展示次数分别满足预设条件的历史搜索结果确定的;根据对应关系,从多个搜索结果中获取至少两种类型的目标搜索结果;显示目标搜索结果。
-
公开(公告)号:CN113434775B
公开(公告)日:2024-03-26
申请号:CN202110802012.6
申请日:2021-07-15
Applicant: 北京达佳互联信息技术有限公司
Inventor: 张志伟
IPC: G06F16/9535 , G06F18/22
Abstract: 本公开关于一种搜索内容的确定方法及装置,该方法包括:接收搜索词,并基于搜索词对数据库中的内容进行召回,得到多个内容;确定多个内容在目标评估指标下的指标值,并根据每个内容对应的指标值对多个内容进行排序,得到目标排序结果;将目标排序结果中的目标分位数的内容对应的指标值确定为阈值;从多个内容中筛选得到目标筛选结果,并获取目标筛选结果中对应的指标值小于阈值的内容,得到过滤结果;将过滤结果确定为搜索词对应的搜索内容,本公开至少解决相关技术中搜索系统搜索到的内容与搜索词不协调的问题。
-
公开(公告)号:CN113254734B
公开(公告)日:2024-01-09
申请号:CN202110559194.9
申请日:2021-05-21
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/9035 , G06F16/9038
Abstract: 本公开关于一种点击模型确定方法、搜索方法、装置、服务器及计算机可读存储介质。点击模型确定方法,包括:通过历史点击模型确定样本搜索词的第一搜索结果,以及通过新增点击模型确定样本搜索词的第二搜索结果;确定第一搜索结果对应的第一评价信息,以及确定第二搜索结果对应的第二评价信息;根据第一评价信息和所述第二评价信息,确定样本搜索词的有效点击模型。本公开实现了针对不同搜索词可以采用不同的点击模型进行搜索,从而可以提高搜索结果的搜索质量。
-
公开(公告)号:CN114595313A
公开(公告)日:2022-06-07
申请号:CN202011418586.5
申请日:2020-12-07
Applicant: 北京达佳互联信息技术有限公司
Inventor: 张志伟
IPC: G06F16/332 , G06F16/338 , G06F40/284 , G06F40/289 , G06K9/62 , G06V30/41
Abstract: 本公开关于一种信息检索结果处理方法、装置、服务器及存储介质,该方法可包括:根据搜索词得到候选对象集合,以及确定与所述搜索词对应的目标主题集合;初始化信息检索结果队列;重复执行以下步骤,直至所述候选对象集合为空集:根据所述候选对象集合中的每个候选对象包含的对象主题,以及所述目标主题集合,计算所述每个候选对象的多样性指标;将所述多样性指标满足预设条件的候选对象确定为检索结果对象;将所述检索结果对象添加至所述信息检索结果队列的尾部,以及将所述检索结果对象从所述候选对象集合中删除;若所述候选对象集合为空集,输出所述信息检索结果队列。本公开能够提高检索结果的主题覆盖率,增强检索结果的多样性。
-
公开(公告)号:CN111881349B
公开(公告)日:2022-04-22
申请号:CN202010699772.4
申请日:2020-07-20
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/9535 , G06F16/9538 , G06N3/04 , G06N3/08
Abstract: 本申请涉及计算机技术领域,公开了一种内容搜索的方法及装置,用以提高搜索准确度。该方法包括:根据接收到的账号的搜索信息,获取账号对应的至少一组资源关联信息,每组资源关联信息包括分别利用搜索信息、账号的账号信息和账号对应的一个候选资源信息进行特征提取得到的资源关联信息;再对每组资源关联信息分别进行特征拼接,得到多个交叉特征信息;基于各个交叉特征信息,分别确定对应的第一关联度特征和第二关联度特征,并基于各个第一关联度特征和对应的第二关联度特征,确定账号与各个候选资源信息的预测相关度;基于各个预测相关度对各个候选资源信息进行排序。综合考虑搜索信息、账号信息与候选资源信息,有利于提高预测准确率。
-
公开(公告)号:CN110428003B
公开(公告)日:2022-04-22
申请号:CN201910703812.5
申请日:2019-07-31
Applicant: 清华大学 , 北京达佳互联信息技术有限公司
IPC: G06V10/764 , G06V10/762 , G06K9/62 , G06T3/00
Abstract: 本公开公开了一种样本类别标签的修正方法、装置以及电子设备,涉及数据处理技术领域,其中,该样本类别标签的修正方法包括:响应于候选可信点选择操作指示,对实例视图中的投射点进行选择,并展示各候选可信点以及对应的类别标签;响应于用户操作对用户选中的候选可信点的类别标签进行更正得到可信数据集;基于可信数据集和各类标注数据,修正标注数据的类别标签;依据修正后的类别标签对应的渲染效果,在实例视图中渲染各类标注数据的投射点,该方式便于用户直观的观察标注数据的聚类分布,选择合适的标注数据并对类别标签有误的标注数据进行更正,通过可视化视图并结合人的经验实现对类别标签的修正,进一步地提高了样本类别标签修正的准确性。
-
公开(公告)号:CN113434775A
公开(公告)日:2021-09-24
申请号:CN202110802012.6
申请日:2021-07-15
Applicant: 北京达佳互联信息技术有限公司
Inventor: 张志伟
IPC: G06F16/9535 , G06K9/62
Abstract: 本公开关于一种搜索内容的确定方法及装置,该方法包括:接收搜索词,并基于搜索词对数据库中的内容进行召回,得到多个内容;确定多个内容在目标评估指标下的指标值,并根据每个内容对应的指标值对多个内容进行排序,得到目标排序结果;将目标排序结果中的目标分位数的内容对应的指标值确定为阈值;从多个内容中筛选得到目标筛选结果,并获取目标筛选结果中对应的指标值小于阈值的内容,得到过滤结果;将过滤结果确定为搜索词对应的搜索内容,本公开至少解决相关技术中搜索系统搜索到的内容与搜索词不协调的问题。
-
公开(公告)号:CN111984803B
公开(公告)日:2021-08-17
申请号:CN202010845865.3
申请日:2020-08-20
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种多媒体资源处理方法、装置、计算机设备及存储介质,属于计算机技术领域。本公开实施例提供的多媒体资源处理方式,考虑到用户更倾向于对相同或相似的多媒体资源进行反馈,引入了行为数据这种信息源,不局限于已有的样本数据,突破了数据瓶颈,将行为数据转化为一种图数据,账号和多媒体资源映射为图中的节点,节点之间的连接关系能够形象地、清晰地体现多个账号和多个多媒体资源之间的反馈关系,通过这种节点之间的连接关系,能够根据已知分类结果的多媒体资源,对未知分类结果的多媒体资源进行准确分类,打破了数据瓶颈,且无需人工标注增加训练样本,通过已有数据即可完成所有的多媒体资源的分类,分类效率高。
-
公开(公告)号:CN107679513B
公开(公告)日:2021-07-13
申请号:CN201710984142.X
申请日:2017-10-20
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本发明实施例公开了图像处理方法、装置及服务器,包括下述步骤:获取待处理的人脸图像;将所述人脸图像输入到构建有损失函数的卷积神经网络模型中,所述损失函数根据预设期望指向性的筛选增大图像分类后的类间距离;获取所述卷积神经网络模型输出的分类数据,并根据所述分类数据对所述人脸图像进行内容理解。通过在卷积神经网络模型上构建新的损失函数,该损失函数具有晒选增大图像分类后类间距的作用,通过该损失函数训练得到的卷积神经网络模型,输出的分类数据的类间距离增大,使图像识别过程中类间距离增大,图像之间差别的显著性明显提高,致使图像比对时准确性明显的提高,应用该图像处理方法的安全性也得到了有效地保障。
-
-
-
-
-
-
-
-
-