-
公开(公告)号:CN107230108A
公开(公告)日:2017-10-03
申请号:CN201710443935.0
申请日:2017-06-13
Applicant: 北京百分点信息科技有限公司
CPC classification number: G06Q30/0201 , G06Q40/025
Abstract: 本发明实施例提供了一种业务数据的处理方法及装置,其中方法包括:利用预先构造的业务数据模型对指定机构中待挖掘用户的业务数据进行分析,得到所述待挖掘用户的转化率;检测所述待挖掘用户的转化率是否达到预设的第一阈值;若检测到所述待挖掘用户的转化率达到预设的第一阈值,确定所述待挖掘用户为所述指定机构的潜在种子用户。本发明实施例的技术方案,能够提高客户转化率,提高客户的信用度使用程度,降低营销成本。
-
公开(公告)号:CN106991598A
公开(公告)日:2017-07-28
申请号:CN201710224488.X
申请日:2017-04-07
Applicant: 北京百分点信息科技有限公司
CPC classification number: G06Q30/0631 , G06Q40/06 , H04L67/26
Abstract: 本发明公开一种数据推送方法及其系统,其中所述方法包括:获取与第一用户相关联的多个业务产品信息;计算所述多个业务产品之间的相似度,获取相似度大于预设值的第一业务产品和第二业务产品;若第二用户与所述第一业务产品关联并不与所述第二业务产品关联,则设置所述第二用户与所述第二业务产品关联,并将所述第二业务产品推送至所述第二用户;其中所述第一用户和所述第二用户具有相同或相关的属性信息。通过本发明实现了业务产品推荐的智能化、自动化和个性化。
-
公开(公告)号:CN105447184A
公开(公告)日:2016-03-30
申请号:CN201510938034.X
申请日:2015-12-15
Applicant: 北京百分点信息科技有限公司
IPC: G06F17/30
CPC classification number: G06F16/951
Abstract: 本发明实施例提供一种信息抓取方法及装置。统计信息网站列表,并将所述信息网站对应的列表页保存在第一数据库中的列表页数据库,其中,所述列表页中保存有所述信息网站与对应的URL地址的对照关系;从所述第一数据库中读取所述列表页的内容,抓取符合预设抓取策略的所述详情页链接地址并将所述抓取后的所述详情页链接地址保存在所述第一数据库中的详情页数据库;将所述详情页链接地址分配到不同的抓取机器上进行抓取,并将抓取得到的网页详情数据保存在第二数据库中;根据所述第一数据库中的数据库状态码从所述第二数据库中抓取出相应的所述网页详情数据,并抽取目标字段,保存为目标格式。实现了信息抓取的实时性、高效性以及智能性。
-
公开(公告)号:CN111459474A
公开(公告)日:2020-07-28
申请号:CN202010176562.7
申请日:2020-03-13
Applicant: 北京百分点信息科技有限公司
IPC: G06F8/36
Abstract: 本申请公开一种模板化的数据处理方法及装置。所述方法包括:确定包含待处理数据、以及框架标识的数据处理请求;获取为所述框架标识对应的大数据处理框架预设的特殊处理逻辑,所述特殊处理逻辑包括相比于其他大数据处理框架、具有特殊性的处理逻辑;根据所述特殊处理逻辑,以及预设的算子模板,生成适配于所述大数据处理框架的目标算子,所述预设的算子模板中包括适配于多种大数据处理框架的通用处理逻辑、以及为特殊处理逻辑预留的空位;响应于所述数据处理请求,根据所述待处理数据,利用所述目标算子执行数据处理。
-
公开(公告)号:CN110543549A
公开(公告)日:2019-12-06
申请号:CN201910818133.2
申请日:2019-08-30
Applicant: 北京百分点信息科技有限公司
IPC: G06F16/33 , G06F16/332 , G06F16/35 , G06F17/27
Abstract: 本申请公开了语义等价性判断方法及装置。该方法包括:根据第一语句和第二语句生成第一语句所对应的多个向量以及第二语句所对应的多个向量;将第一语句所对应的多个向量与第二语句所对应的多个向量进行匹配,并根据匹配结果生成相似度表示;将相似度表示拼接后通过模型的相似度表示层进行筛选;将筛选结果输入模型的自注意层,并通过自注意层计算自注意力值,自注意力值反映第一语句和第二语句的内部结构;根据自注意力值判断所述第一语句与所述第二语句之间的语义是否等价。由于该方法对多个句子之间语义是否等价的判断结果,相对于现有技术准确性更高,因此能够用于解决现有技术中的问题。
-
公开(公告)号:CN110489625A
公开(公告)日:2019-11-22
申请号:CN201910690874.7
申请日:2019-07-29
Applicant: 北京百分点信息科技有限公司
IPC: G06F16/951 , G06F16/958
Abstract: 本发明公开了一种采集网页数据模板的生成方法、装置、电子设备和计算机可读存储介质。该方法包括:接收对网页中至少一个目标元素的选取指令,确定选取的目标元素的DOM路径,确定选取的目标内容的DOM路径;根据所述DOM路径生成解析模板;接收用户对所述解析模板中DOM路径的修改操作得到目标解析模板,其中,修改后的所述DOM路径中,用通配规则表示目标内容的DOM路径中的特殊属性值;所述目标解析模板用于对所述网页中的目标元素进行采集。
-
公开(公告)号:CN110162632A
公开(公告)日:2019-08-23
申请号:CN201910414328.0
申请日:2019-05-17
Applicant: 北京百分点信息科技有限公司
Abstract: 本发明公开了一种新闻专题事件发现的方法,主要包括:S1、对每篇给定的新闻文章进行事件主题句识别;S2、对每篇给定的新闻文章进行事件核心元素抽取;S3、利用步骤S2中提取的每篇新闻文章的事件核心元素判别文章相似性。本发明方法基于事件元素抽取(Event extraction)技术、话题追踪检测(Topic Detection and Tracking)、事件关系发现及专题新闻增量追加技术,来实现新闻文本的专题事件发现和聚类,实现新闻文本的基于话题进行专题聚类和发现的方法,使用者无需提供标注训练数据,也无需提供事件类型模板,无需了解相关领域知识,即可实现高质量的专题聚类和事件发现。
-
公开(公告)号:CN108199795B
公开(公告)日:2019-05-10
申请号:CN201711485067.9
申请日:2017-12-29
Applicant: 北京百分点信息科技有限公司
Abstract: 本发明公开了一种设备状态的监测方法和装置,该方法包括:获取对设备进行监测得到的监测数据;根据预先确定的状态监测模型,确定监测数据对应的异常值,状态监测模型根据设备的历史监测数据确定得到,异常值用于表征设备是否处于异常状态;根据异常值,对设备的状态进行监测。本发明实施例预先确定用于对设备的状态进行监测的状态监测模型,在对该设备的状态进行监测时,可以根据实时获取的该设备的监测数据,确定得到用于表征该设备状态的异常值,根据该异常值对设备的状态进行监测。这样,可以实现对设备状态的模型分析和智能监测,进而提高对设备状态进行监测的准确度和精确度,以及提高故障应对能力和智能化水平。
-
公开(公告)号:CN107016571A
公开(公告)日:2017-08-04
申请号:CN201710209687.3
申请日:2017-03-31
Applicant: 北京百分点信息科技有限公司
CPC classification number: G06Q30/0202 , G06K9/6267
Abstract: 本发明公开一种数据预测方法及其系统,其中所述方法包括:通过数据库获取单一业务的数据信息,其中所述数据信息包括多维度的特征变量;通过多元回归方法,结合最小信息准则AIC值与贝叶斯信息准则BIC值,对所述多维度的特征变量进行数据筛选,过滤数据噪音;将数据筛选后的特征变量导入到机器学习模型中,对数据进行建模分析。通过本发明有效提高了数据预测的精准度。
-
公开(公告)号:CN106844056A
公开(公告)日:2017-06-13
申请号:CN201710056121.1
申请日:2017-01-25
Applicant: 北京百分点信息科技有限公司
Abstract: 本发明公开一种Hadoop大数据平台多租户作业管理方法及其系统,其中所述方法包括:为指定用户预分配作业资源信息;提供作业提交界面,通过所述作业提交界面接收来自指定用户的作业数据及其作业参数;根据所述作业资源信息对所述作业数据进行包装,建立所述作业资源信息与所述作业数据之间的对应关系;当所述作业数据被调度时,根据所述作业资源信息设置所述作业数据的作业参数,以使根据所述作业参数在大数据平台运行所述作业数据。通过本发明降低了大数据平台的资源消耗,节省了平台的建设成本。
-
-
-
-
-
-
-
-
-