-
公开(公告)号:CN109582675A
公开(公告)日:2019-04-05
申请号:CN201811446459.9
申请日:2018-11-29
Applicant: 北京达佳互联信息技术有限公司
Inventor: 王树强
IPC: G06F16/22 , G06F16/332
Abstract: 本公开是关于一种标签匹配方法、装置、服务器及存储介质,属于数据处理技术领域。本公开的实施例提供的技术方案通过将待匹配的至少一个第二标签与树形数据集中存储的至少一个第一标签进行匹配,通过树形数据集的形式,来进行标签匹配的过程,能够提高标签匹配的自动化程度,大大减少了人工进行标签匹配的成本,也能够避免由于人工匹配而造成的匹配错误,提高了标签匹配的正确率。
-
公开(公告)号:CN109409414A
公开(公告)日:2019-03-01
申请号:CN201811142162.3
申请日:2018-09-28
Applicant: 北京达佳互联信息技术有限公司
IPC: G06K9/62
Abstract: 本公开是关于一种样本图像确定方法和装置、电子设备及存储介质,其中所述方法包括:采用第一预设数量的分类器分别对各样本图像进行预测,得到所述各样本图像对应的预测向量;分别将所述各样本图像对应的预测向量转化成概率向量;依据所述各样本图像对应的概率向量,从所述各样本图像中确定困难样本图像。本公开提供的样本图像确定能够准确、快速的从多个样本图像中提取从困难样本图像,并且无需人工手动干预,能够节省人力资源。
-
公开(公告)号:CN108108390A
公开(公告)日:2018-06-01
申请号:CN201711132051.X
申请日:2017-11-15
Applicant: 北京达佳互联信息技术有限公司
Inventor: 王树强
IPC: G06F17/30
CPC classification number: G06F17/30424 , G06F17/3048
Abstract: 本发明提供了一种数据分发方法和装置,该方法包括:接收用户的数据领取请求;根据所述数据领取请求,在预设数据库中查找未被所述用户领取且分发次数大于零的目标数据;将所述目标数据分发至所述用户,并将所述目标数据的分发次数减一。本发明通过将未被某个用户领取过,且分发次数大于零的数据分发给该用户,从而可以使得同一条数据能够分发给多个人,同时,同一个人对一条数据只能领取一次,从而保证了数据分发的最大化和差异化,通过分散性的收集各个用户对同一数据的处理结果,排除个人对某个数据的处理错误,从而可以保证对分发的数据的处理结果的准确性,提升数据分发的可靠性和准确性。
-
公开(公告)号:CN109543714A
公开(公告)日:2019-03-29
申请号:CN201811204515.8
申请日:2018-10-16
Applicant: 北京达佳互联信息技术有限公司
IPC: G06K9/62
Abstract: 本申请提供了一种数据特征的获取方法、装置、电子设备及存储介质,包括:获取包括图像信息和文本信息的多媒体样本;分别提取图像信息的第一图像特征以及文本信息的第一文本特征;将第一图像特征和第一文本特征导入注意力机制模型,输出基于第一图像特征的注意力的第二文本特征,和/或基于第一文本特征的注意力的第二图像特征。本申请基于注意力机制,捕捉第一图像特征和第一文本特征之间的关联性,并得到应用了注意力机制的第二文本特征和/或第二图像特征,使得第二文本特征和第二图像特征包括了图像信息和文本信息之间的关联性,本申请获取的应用了注意力机制的特征是基于一个端到端的注意力机制模型实现的,减少了应用场景对多模型的依赖。
-
公开(公告)号:CN109409414B
公开(公告)日:2019-10-15
申请号:CN201811142162.3
申请日:2018-09-28
Applicant: 北京达佳互联信息技术有限公司
IPC: G06K9/62
Abstract: 本公开是关于一种样本图像确定方法和装置、电子设备及存储介质,其中所述方法包括:采用第一预设数量的分类器分别对各样本图像进行预测,得到所述各样本图像对应的预测向量;分别将所述各样本图像对应的预测向量转化成概率向量;依据所述各样本图像对应的概率向量,从所述各样本图像中确定困难样本图像。本公开提供的样本图像确定能够准确、快速的从多个样本图像中提取从困难样本图像,并且无需人工手动干预,能够节省人力资源。
-
公开(公告)号:CN109543714B
公开(公告)日:2020-03-27
申请号:CN201811204515.8
申请日:2018-10-16
Applicant: 北京达佳互联信息技术有限公司
IPC: G06K9/62
Abstract: 本申请提供了一种数据特征的获取方法、装置、电子设备及存储介质,包括:获取包括图像信息和文本信息的多媒体样本;分别提取图像信息的第一图像特征以及文本信息的第一文本特征;将第一图像特征和第一文本特征导入注意力机制模型,输出基于第一图像特征的注意力的第二文本特征,和/或基于第一文本特征的注意力的第二图像特征。本申请基于注意力机制,捕捉第一图像特征和第一文本特征之间的关联性,并得到应用了注意力机制的第二文本特征和/或第二图像特征,使得第二文本特征和第二图像特征包括了图像信息和文本信息之间的关联性,本申请获取的应用了注意力机制的特征是基于一个端到端的注意力机制模型实现的,减少了应用场景对多模型的依赖。
-
公开(公告)号:CN108108390B
公开(公告)日:2019-02-19
申请号:CN201711132051.X
申请日:2017-11-15
Applicant: 北京达佳互联信息技术有限公司
Inventor: 王树强
IPC: G06F16/245 , G06F16/2455
Abstract: 本发明提供了一种数据分发方法和装置,该方法包括:接收用户的数据领取请求;根据所述数据领取请求,在预设数据库中查找未被所述用户领取且分发次数大于零的目标数据;将所述目标数据分发至所述用户,并将所述目标数据的分发次数减一。本发明通过将未被某个用户领取过,且分发次数大于零的数据分发给该用户,从而可以使得同一条数据能够分发给多个人,同时,同一个人对一条数据只能领取一次,从而保证了数据分发的最大化和差异化,通过分散性的收集各个用户对同一数据的处理结果,排除个人对某个数据的处理错误,从而可以保证对分发的数据的处理结果的准确性,提升数据分发的可靠性和准确性。
-
公开(公告)号:CN109145937A
公开(公告)日:2019-01-04
申请号:CN201810664585.5
申请日:2018-06-25
Applicant: 北京达佳互联信息技术有限公司
CPC classification number: G06K9/6267 , G06K9/6218 , G06K9/6256 , G06N3/0454
Abstract: 本发明实施例提供了一种模型训练的方法及装置,其中所述方法包括:获取指定分类类别中的待训练的样本数据;对所述待训练的样本数据进行特征提取,获得所述指定分类类别对应的特征信息;对所述指定分类类别对应的特征信息进行聚类,得到多个聚类标签;对所述聚类标签对应的样本数据进行数据均衡处理;将数据均衡处理后的样本数据作为目标样本数据;采用所述目标样本数据,训练指定模型。本发明可以通过上述无监督的方法细化已有分类类别内的标签,实现类别内的样本均衡,为模型提供均衡的样本数据,根据该均衡的样本数据进行模型训练可以得到优化的模型,采用该优化的模型进行数据预测可以得到更准确的预测结果,提高模型预测的准确率。
-
-
-
-
-
-
-