-
公开(公告)号:CN106528777A
公开(公告)日:2017-03-22
申请号:CN201610977040.0
申请日:2016-10-27
Applicant: 北京百分点信息科技有限公司
IPC: G06F17/30
CPC classification number: G06F16/285 , G06F16/2465
Abstract: 本发明公开一种跨屏用户标识归一的方法及其系统,其中该方法包括:针对多个终端设备,分别根据每个终端设备的标识信息从预先建立的数据库中获取每个终端设备对应的行为属性信息;根据终端设备的行为属性信息确定多个候选集合,其中每个候选集中包括相关联的多个终端设备;提取所述多个候选集合的特征参数作为训练数据并构建分类模型;根据所述分类模型确定待预测数据的分类信息,并将同一分类的终端设备生成统一的标识信息。通过本发明能够有效确定相关联的终端设备。
-
公开(公告)号:CN106202503A
公开(公告)日:2016-12-07
申请号:CN201610574191.1
申请日:2016-07-19
Applicant: 北京百分点信息科技有限公司
IPC: G06F17/30
CPC classification number: G06F16/958 , G06F16/9535
Abstract: 本发明实施例提供一种数据处理方法及装置,涉及计算机技术领域。其中,所述方法包括:当监听到有新的网络数据时,将所述新的网络数据存储至数据源;采用流式计算框架storm将所述数据源中的网络数据进行拓扑处理,得到数据拓扑;将所述数据拓扑中的各网络数据发射至storm中对应的数据操作节点bolt中进行处理,得到处理结果;将所述处理结果存入存储介质中。本发明实施例提供的技术方案实现了数据处理的实时性。
-
公开(公告)号:CN112182195A
公开(公告)日:2021-01-05
申请号:CN202011165913.0
申请日:2020-10-27
Applicant: 北京百分点信息科技有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/28 , G06F16/338
Abstract: 本公开涉及一种自动问答方法、装置、可读存储介质及电子设备。方法包括:响应于接收到用户输入的问答语句,确定所述问答语句的问答类型信息,其中,所述问答类型信息包括问答跳数和所述问答语句的查询结构,所述查询结构包括链式结构和夹式结构;获取所述问答语句中的实体;根据所述问答语句、所述实体和所述问答语句的问答类型信息,确定与所述问答语句匹配的目标回答语句。如此,可以解决现有技术中无法查询出夹式结构的问答语句的答案的问题,实现既可以查找到链式结构的问题的答案,也可以查找到夹式结构问题的答案的目的,提高了自动问答的适用范围,提升了用户使用体验。
-
公开(公告)号:CN111861759A
公开(公告)日:2020-10-30
申请号:CN202010542093.6
申请日:2020-06-15
Applicant: 北京百分点信息科技有限公司
IPC: G06Q40/08 , G06F16/9535
Abstract: 本发明公开了一种产品与客户群体的匹配方法和系统,该方法包括:获取用户输入的标签集合;计算所述标签集合对应的效用矩阵得到结果矩阵,其中,所述效用矩阵基于标签集合矩阵和偏好系数矩阵确定,所述标签集合矩阵表示对象与对象标签集合的对应关系,所述对象包括产品或者客户群体,所述偏好系数矩阵表示客户群体与产品之间的偏好度;根据所述结果矩阵的元素的值确定与所述标签集合匹配的目标标签集合;根据所述目标标签集合确定匹配的目标对象,所述目标对象包括目标产品或者目标客户群体。本实施例可以基于产品确定匹配的客户群体以及根据客户群体确定匹配度产品,提高产品与客户群体的匹配精度。
-
公开(公告)号:CN111460317A
公开(公告)日:2020-07-28
申请号:CN202010238810.6
申请日:2020-03-30
Applicant: 北京百分点信息科技有限公司
IPC: G06F16/9536 , G06F16/951 , G06Q50/00
Abstract: 本说明书实施例公开了一种意见领袖的识别方法、装置及电子设备,用于提高意见领袖的识别效果。该方法包括:确定话题网络中的节点用户是意见领袖的概率;将所述概率以及所述节点用户的多个指标参数输入预设模型,得到所述多个指标参数分别对应的比例系数;其中,所述概率和所述多个指标参数以及所述多个指标参数分别对应的比例系数相关;基于所述多个指标参数以及所述多个指标参数分别对应的比例系数,得到所述节点用户的权重;基于所述节点用户的权重,通过PageRank算法识别出所述话题网络中的意见领袖。
-
公开(公告)号:CN110909535A
公开(公告)日:2020-03-24
申请号:CN201911244893.3
申请日:2019-12-06
Applicant: 北京百分点信息科技有限公司
IPC: G06F40/232 , G06F40/295
Abstract: 本公开涉及一种命名实体校对方法、装置、可读存储介质及电子设备。方法包括:基于中文分词结果,从待识别文本中提取第一命名实体,所述第一命名实体包括第一人名和/或第一职务;基于预设的数据库,从所述待识别文本中提取第二命名实体,所述第二命名实体包括第二人名和/或第二职务,所述预设的数据库中包括预设的人名和/或职务;根据所述第二命名实体,对所述第一命名实体进行纠错处理。由于是基于预设的数据库提取的第二命名实体,所以,所提取的第二命名实体较为准确,进而基于该较为准确的第二命名实体辅助对第一命名识别进行纠错处理,可以提高对待识别文本中的第一命名实体校对的准确度。
-
公开(公告)号:CN110855526A
公开(公告)日:2020-02-28
申请号:CN201911143589.X
申请日:2019-11-20
Applicant: 北京百分点信息科技有限公司
IPC: H04L12/26
Abstract: 本公开涉及一种检测数据源连接的方法、装置、存储介质及电子设备,首先获取待检测的目标数据源的连接地址信息,然后根据所述连接地址信息进行telnet验证,得到所述客户端与所述目标数据源的网络服务连通结果,所述网络服务连通结果用于表示所述客户端与所述目标数据源之间的网络是否连通,若所述网络服务连通结果表示所述客户端与所述目标数据源之间的网络不连通,输出第一提示信息,所述第一提示信息用于提示用户所述客户端与所述目标数据源之间的网络不连通。
-
公开(公告)号:CN110704871A
公开(公告)日:2020-01-17
申请号:CN201910900541.2
申请日:2019-09-23
Applicant: 北京百分点信息科技有限公司
IPC: G06F21/62
Abstract: 本发明公开了一种权限管理方法、装置、电子设备以及计算机可读存储介质。该方法包括:接收用户对多源融合数据的数据访问请求;获取所述用户请求访问的数据,其中所述数据包括至少一个属性值;确定所述用户对所述数据的数据源的权限;根据所述属性值的数据源标识和所述权限,确定用户对所述属性值的权限,并执行与所述属性值的权限对应的操作;其中所述数据源标识用于表征所述属性值的数据源。
-
公开(公告)号:CN110471954A
公开(公告)日:2019-11-19
申请号:CN201910693030.8
申请日:2019-07-29
Applicant: 北京百分点信息科技有限公司
IPC: G06F16/2458
Abstract: 本申请公开了一种数据挖掘方法和装置。该方法包括:获取数据表的元数据以及根据所述数据表中所存储的数据预先生成的图表的结构数据,其中所述结构数据用于描述所述图表的结构;根据所述数据表的元数据以及所述图表的结构数据生成至少一个目标元数据;通过各所述目标元数据,分别从所述数据表中筛选出对应的子数据表,用于数据挖掘。由于生成目标元数据的过程中结合了图表的结构数据以及数据表的元数据,相对于现有技术直接针对数据表进行分析挖掘,通过该目标元数据所筛选出的子数据表更能够细致和全面的体现出所挖掘的信息,因此能够解决现有技术中的问题。
-
公开(公告)号:CN110134950A
公开(公告)日:2019-08-16
申请号:CN201910349756.X
申请日:2019-04-28
Applicant: 北京百分点信息科技有限公司
Abstract: 本发明公开了一种字词结合的文本自动校对方法,首先分别采用如下两种查错方法进行查错:1)基于n-gram语言模型的查错方法;2)基于lstm语言模型的查错方法;然后将两种方法的查错结果求交集,得到最终的查错结果。本发明方法基于词符嵌入(word embeddings)技术、双向lstm网络、CRF(Conditional Random Field,条件随机场)模型等实现对输入文本进行分词与词性标注,在此基础上基于n-gram模型、双向lstm语言模型以及规则策略,实现文本中存在的错误查找。
-
-
-
-
-
-
-
-
-