-
公开(公告)号:CN110647547A
公开(公告)日:2020-01-03
申请号:CN201910895091.2
申请日:2019-09-20
Applicant: 北京百分点信息科技有限公司
IPC: G06F16/2455 , G06F16/2458
Abstract: 本说明书实施例公开了一种消费延迟监控方法、装置、电子设备及计算机可读存储介质。其中,该方法应用于基于Spark Streaming框架的流处理系统,包括:按照预设时间间隔从Kafka系统中读取流数据,所述流数据中包括多条携带有生产时间戳的业务数据;基于所述流数据中的目标业务数据的生产时间戳确定所述Kafka系统的消费延迟时间,其中,所述目标业务数据为所述流数据中生产时间戳最晚的业务数据;基于所述消费延迟时间,对所述Kafka系统进行消费延迟监控。本申请能够实现对Kafka系统中的消费延迟信息的有效监控。
-
公开(公告)号:CN110543483A
公开(公告)日:2019-12-06
申请号:CN201910816902.5
申请日:2019-08-30
Applicant: 北京百分点信息科技有限公司
IPC: G06F16/22 , G06F16/2455
Abstract: 本发明实施例公开了一种数据稽核方法、装置及电子设备,用于解决现有技术无法精确获知每个表中每条数据记录的稽核结果,无法对一张表的数据进行整体把关的问题。该数据稽核方法包括:获取待稽查数据表;基于所述待稽查数据表,从指定数据库中获取所述待稽查数据表对应的稽核配置;基于所述稽核配置,对所述待稽查数据表中的待稽核数据记录进行稽核校验;输出各所述待稽核数据记录的稽核结果,能够精确获知每个表中每条数据记录的稽核结果,可以对一张表的数据进行整体把关。
-
公开(公告)号:CN106202503B
公开(公告)日:2019-08-16
申请号:CN201610574191.1
申请日:2016-07-19
Applicant: 北京百分点信息科技有限公司
IPC: G06F16/958 , G06F16/9535
Abstract: 本发明实施例提供一种数据处理方法及装置,涉及计算机技术领域。其中,所述方法包括:当监听到有新的网络数据时,将所述新的网络数据存储至数据源;采用流式计算框架storm将所述数据源中的网络数据进行拓扑处理,得到数据拓扑;将所述数据拓扑中的各网络数据发射至storm中对应的数据操作节点bolt中进行处理,得到处理结果;将所述处理结果存入存储介质中。本发明实施例提供的技术方案实现了数据处理的实时性。
-
公开(公告)号:CN110008323A
公开(公告)日:2019-07-12
申请号:CN201910236751.6
申请日:2019-03-27
Applicant: 北京百分点信息科技有限公司
IPC: G06F16/332 , G06F17/27 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种半监督学习结合集成学习的问题等价性判别的方法,包括S1、同义词归一化:1)词向量嵌入;2)词语相似度判断;3)人工判断;S2、语义等价性识别:基于LSTM的对偶网络的计算;基于CNN的对偶网络模型的计算;基于Match Pyramid模型的计算;人工提取特征。本发明通过半监督的方式生成并引入同义词,从而使得整个系统可以根据具体领域进行灵活调整,并通过集合学习四种不同模型对问题的语义等价性进行判断,从而发挥不同模型的优势。
-
公开(公告)号:CN109918869A
公开(公告)日:2019-06-21
申请号:CN201910112308.8
申请日:2019-02-13
Applicant: 北京百分点信息科技有限公司
IPC: G06F21/12
Abstract: 本发明公开了一种基于模板的统一license控制方法,包括如下步骤:步骤S1、基于预先设定的模板格式,编写license基础信息文件;步骤S2、使用license生成程序加密生成license文件;步骤S3、上传至license服务端;步骤S4、当客户需要访问产品客户端的时候,产品客户端自动收集当前环境信息并进行加密处理,发送至license服务端;步骤S5、license服务端对环境信息进行数据解密和解析,并将其匹配查询对应的license基础信息;步骤S6、当查询到内存中对应的license基础信息后开始对数据进行比对,比对产品客户端收集的环境信息是否与license基础信息文件的内容的数据一致;如果不一致就会向产品客户端返回验证失败的信息。本发明可以有效节约开发时间、成本和提交检验效率。
-
公开(公告)号:CN108197109A
公开(公告)日:2018-06-22
申请号:CN201711488119.8
申请日:2017-12-29
Applicant: 北京百分点信息科技有限公司
Abstract: 一种基于自然语言处理的多语言分析方法和装置,包括:通过语种检测训练模型选择输入自然语句文本信息语言种类;通过训练得到的词向量模型,得到计算机可识别的对应词语的词嵌入表达信息,并对得到的词嵌入表达信息通过TF-IDF方式提取得到关键词;根据关键词和关键词权重计算得到文章向量和每个预设类目的类目向量,计算自然语句文本信息的文章与每个预设类目的相似度来确定所述自然语句文本信息的文本分类结果;将自然语句文本信息的词嵌入表达信息,输入训练后的卷积神经网络和双向门循环单元的并行架构的文本情感分析模型,并通过计算得到最终的情感倾向值。本发明解决了传统多语言分析方法需要了解相关语言学的领域知识且需要大量人工操作的问题。
-
公开(公告)号:CN106383765A
公开(公告)日:2017-02-08
申请号:CN201610800172.6
申请日:2016-08-31
Applicant: 北京百分点信息科技有限公司
IPC: G06F11/30
CPC classification number: G06F11/3051 , G06F2201/865
Abstract: 本申请公开了一种数据监控方法及装置,用以解决现有技术在通过自定义监控事件对数据进行监控时,由于需要编写代码,而造成数据监控效率较低的问题。方法包括:获得并展示待监控应用的界面信息;检测针对所述界面信息的交互事件;根据检测到的所述交互事件,建立自定义监控事件,以用于对所述待监控应用进行监控。本申请还公开了一种数据监控系统。
-
公开(公告)号:CN105741134A
公开(公告)日:2016-07-06
申请号:CN201610052689.1
申请日:2016-01-26
Applicant: 北京百分点信息科技有限公司
IPC: G06Q30/02
CPC classification number: G06Q30/0255 , G06Q30/0271 , G06Q30/0277
Abstract: 本发明实施例提供一种跨数据源的营销人群在市场营销中应用的方法及装置。实时获取多数据源的用户数据,并根据所述用户数据得到用户画像;根据所述用户画像进行市场营销活动;获取市场营销活动的反馈结果并根据所述反馈结果优化所述市场营销活动。为市场营销各环节提供客观的数据依据,以及优质数据和营销经验的积累。
-
公开(公告)号:CN112241458A
公开(公告)日:2021-01-19
申请号:CN202011089921.1
申请日:2020-10-13
Applicant: 北京百分点信息科技有限公司
IPC: G06F16/36 , G06F16/35 , G06F40/295
Abstract: 本申请实施例提供了一种文本的知识结构化处理方法、装置、设备和可读存储介质,其中,方法包括:对待处理文本根据业务特征进行分类处理,得到所述待处理文本的业务类型;根据所述待处理文本的业务类型,对所述待处理文本进行实体提取处理,得到所述待处理文本的实体要素;基于所述实体要素在有向连接实体关系图中的入度值和在所述待处理文本中的相对距离值,对所述待处理文本进行关系抽取处理,确定所述待处理文本的实体关系对,得到所述待处理文本的知识结构化信息。本申请实施例不需要大量的数据标注和较高的硬件资源,可以有效提升关系抽取的准确性,节约人工和成本,满足实际业务的需求。
-
公开(公告)号:CN110929514A
公开(公告)日:2020-03-27
申请号:CN201911144534.0
申请日:2019-11-20
Applicant: 北京百分点信息科技有限公司
IPC: G06F40/289 , G06F40/30
Abstract: 本公开涉及一种文本校对方法、装置、计算机可读存储介质及电子设备。方法包括:确定待校对文本中各句子的纠错信息,纠错信息包括错误词和其对应的至少一个纠错词;针对各错误词,分别确定错误词与其前、后词在预设语料库中的第一共现频次、第二共现频次;针对错误词对应的各纠错词,获取语义特征;至少根据第一共现频次、第二共现频次及语义特征,判定纠错词是否正确。判定纠错词的正确性,可提升文本校对准确率。对纠错词的正确性进行判定时,综合考虑了前后词的搭配及上下文语义特征,可保证纠错词的正确性判定的精度,从而进一步提升文本校对准确率。此外,使得校对工作智能化、自动化,减轻人工校对的压力,提升工作效率,降低人工成本。
-
-
-
-
-
-
-
-
-