-
公开(公告)号:CN110428003B
公开(公告)日:2022-04-22
申请号:CN201910703812.5
申请日:2019-07-31
Applicant: 清华大学 , 北京达佳互联信息技术有限公司
IPC: G06V10/764 , G06V10/762 , G06K9/62 , G06T3/00
Abstract: 本公开公开了一种样本类别标签的修正方法、装置以及电子设备,涉及数据处理技术领域,其中,该样本类别标签的修正方法包括:响应于候选可信点选择操作指示,对实例视图中的投射点进行选择,并展示各候选可信点以及对应的类别标签;响应于用户操作对用户选中的候选可信点的类别标签进行更正得到可信数据集;基于可信数据集和各类标注数据,修正标注数据的类别标签;依据修正后的类别标签对应的渲染效果,在实例视图中渲染各类标注数据的投射点,该方式便于用户直观的观察标注数据的聚类分布,选择合适的标注数据并对类别标签有误的标注数据进行更正,通过可视化视图并结合人的经验实现对类别标签的修正,进一步地提高了样本类别标签修正的准确性。
-
公开(公告)号:CN110457155A
公开(公告)日:2019-11-15
申请号:CN201910703759.9
申请日:2019-07-31
Applicant: 清华大学 , 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种样本类别标签的修正方法、装置及电子设备,用于通过可视化方法基于用户标注的数据对类标进行修正。该方法包括:获取分类数据的类标数据,并进行特征提取得到特征数据;对所述特征数据多次采样,按照采样顺序将对应得到的多层特征数据中每相邻两层特征数据按照上下级关系进行级联,构建层次结构图;将所述层次结构图的任一层至少部分区域的特征数据,及所述至少部分区域的特征数据下级级联的特征数据联合,对联合后的特征数据进行降维,对应得到一个二维平面数据;接收基于所述二维平面数据进行标注的数据,得到可信数据集;基于所述可信数据集和所述类标数据,利用双重优化类标数据的修正方法,修正获取的类标数据。
-
公开(公告)号:CN110457155B
公开(公告)日:2020-09-11
申请号:CN201910703759.9
申请日:2019-07-31
Applicant: 清华大学 , 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种样本类别标签的修正方法、装置及电子设备,用于通过可视化方法基于用户标注的数据对类标进行修正。该方法包括:获取分类数据的类标数据,并进行特征提取得到特征数据;对所述特征数据多次采样,按照采样顺序将对应得到的多层特征数据中每相邻两层特征数据按照上下级关系进行级联,构建层次结构图;将所述层次结构图的任一层至少部分区域的特征数据,及所述至少部分区域的特征数据下级级联的特征数据联合,对联合后的特征数据进行降维,对应得到一个二维平面数据;接收基于所述二维平面数据进行标注的数据,得到可信数据集;基于所述可信数据集和所述类标数据,利用双重优化类标数据的修正方法,修正获取的类标数据。
-
公开(公告)号:CN110428003A
公开(公告)日:2019-11-08
申请号:CN201910703812.5
申请日:2019-07-31
Applicant: 清华大学 , 北京达佳互联信息技术有限公司
Abstract: 本公开公开了一种样本类别标签的修正方法、装置以及电子设备,涉及数据处理技术领域,其中,该样本类别标签的修正方法包括:响应于候选可信点选择操作指示,对实例视图中的投射点进行选择,并展示各候选可信点以及对应的类别标签;响应于用户操作对用户选中的候选可信点的类别标签进行更正得到可信数据集;基于可信数据集和各类标注数据,修正标注数据的类别标签;依据修正后的类别标签对应的渲染效果,在实例视图中渲染各类标注数据的投射点,该方式便于用户直观的观察标注数据的聚类分布,选择合适的标注数据并对类别标签有误的标注数据进行更正,通过可视化视图并结合人的经验实现对类别标签的修正,进一步地提高了样本类别标签修正的准确性。
-
公开(公告)号:CN113918822B
公开(公告)日:2025-01-10
申请号:CN202111272983.0
申请日:2021-10-29
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/9535 , G06F16/9538 , G06F18/23213 , G06N20/00
Abstract: 本公开关于一种内容搜索方法、装置、电子设备及存储介质,涉及数据处理技术领域。该方法包括:获取搜索词,并确定搜索词对应的多个搜索结果;读取预先存储的搜索词与至少两种类型的搜索结果之间的对应关系;对应关系是根据搜索词对应的用户满意值和被展示次数分别满足预设条件的历史搜索结果确定的;根据对应关系,从多个搜索结果中获取至少两种类型的目标搜索结果;显示目标搜索结果。
-
公开(公告)号:CN113434775B
公开(公告)日:2024-03-26
申请号:CN202110802012.6
申请日:2021-07-15
Applicant: 北京达佳互联信息技术有限公司
Inventor: 张志伟
IPC: G06F16/9535 , G06F18/22
Abstract: 本公开关于一种搜索内容的确定方法及装置,该方法包括:接收搜索词,并基于搜索词对数据库中的内容进行召回,得到多个内容;确定多个内容在目标评估指标下的指标值,并根据每个内容对应的指标值对多个内容进行排序,得到目标排序结果;将目标排序结果中的目标分位数的内容对应的指标值确定为阈值;从多个内容中筛选得到目标筛选结果,并获取目标筛选结果中对应的指标值小于阈值的内容,得到过滤结果;将过滤结果确定为搜索词对应的搜索内容,本公开至少解决相关技术中搜索系统搜索到的内容与搜索词不协调的问题。
-
公开(公告)号:CN113254734B
公开(公告)日:2024-01-09
申请号:CN202110559194.9
申请日:2021-05-21
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/9035 , G06F16/9038
Abstract: 本公开关于一种点击模型确定方法、搜索方法、装置、服务器及计算机可读存储介质。点击模型确定方法,包括:通过历史点击模型确定样本搜索词的第一搜索结果,以及通过新增点击模型确定样本搜索词的第二搜索结果;确定第一搜索结果对应的第一评价信息,以及确定第二搜索结果对应的第二评价信息;根据第一评价信息和所述第二评价信息,确定样本搜索词的有效点击模型。本公开实现了针对不同搜索词可以采用不同的点击模型进行搜索,从而可以提高搜索结果的搜索质量。
-
公开(公告)号:CN115393849A
公开(公告)日:2022-11-25
申请号:CN202210901461.0
申请日:2022-07-28
Applicant: 北京达佳互联信息技术有限公司 , 北京中科研究院
Abstract: 本公开关于一种数据处理方法、装置、电子设备及存储介质,该方法包括:获取待处理业务图像以及其关联的业务文本;基于提取的待处理业务图像的视觉特征得到视觉提示向量;对视觉提示向量和业务文本进行编码处理得到编码向量;该编码向量包括对应视觉提示向量的视觉编码向量和对应业务文本的文本编码向量;基于所述视觉编码向量和所述文本编码向量中各所述命名实体对应的实体编码向量,确定实体提示向量;基于所述视觉提示向量和所述实体提示向量对所述编码向量进行解码处理,得到所述待处理业务图像对应的描述文本。本公开提高了生成描述文本中命名实体的准确性。
-
公开(公告)号:CN114595313A
公开(公告)日:2022-06-07
申请号:CN202011418586.5
申请日:2020-12-07
Applicant: 北京达佳互联信息技术有限公司
Inventor: 张志伟
IPC: G06F16/332 , G06F16/338 , G06F40/284 , G06F40/289 , G06K9/62 , G06V30/41
Abstract: 本公开关于一种信息检索结果处理方法、装置、服务器及存储介质,该方法可包括:根据搜索词得到候选对象集合,以及确定与所述搜索词对应的目标主题集合;初始化信息检索结果队列;重复执行以下步骤,直至所述候选对象集合为空集:根据所述候选对象集合中的每个候选对象包含的对象主题,以及所述目标主题集合,计算所述每个候选对象的多样性指标;将所述多样性指标满足预设条件的候选对象确定为检索结果对象;将所述检索结果对象添加至所述信息检索结果队列的尾部,以及将所述检索结果对象从所述候选对象集合中删除;若所述候选对象集合为空集,输出所述信息检索结果队列。本公开能够提高检索结果的主题覆盖率,增强检索结果的多样性。
-
公开(公告)号:CN111881349B
公开(公告)日:2022-04-22
申请号:CN202010699772.4
申请日:2020-07-20
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/9535 , G06F16/9538 , G06N3/04 , G06N3/08
Abstract: 本申请涉及计算机技术领域,公开了一种内容搜索的方法及装置,用以提高搜索准确度。该方法包括:根据接收到的账号的搜索信息,获取账号对应的至少一组资源关联信息,每组资源关联信息包括分别利用搜索信息、账号的账号信息和账号对应的一个候选资源信息进行特征提取得到的资源关联信息;再对每组资源关联信息分别进行特征拼接,得到多个交叉特征信息;基于各个交叉特征信息,分别确定对应的第一关联度特征和第二关联度特征,并基于各个第一关联度特征和对应的第二关联度特征,确定账号与各个候选资源信息的预测相关度;基于各个预测相关度对各个候选资源信息进行排序。综合考虑搜索信息、账号信息与候选资源信息,有利于提高预测准确率。
-
-
-
-
-
-
-
-
-