-
公开(公告)号:CN109858041A
公开(公告)日:2019-06-07
申请号:CN201910172675.7
申请日:2019-03-07
Applicant: 北京百分点信息科技有限公司
Abstract: 本发明公开了一种半监督学习结合自定义词典的命名实体识别方法,包括如下步骤:S1、用未标注数据预训练Bi-LSTM语言模型;S2、在Embedding层采用字向量模型将每个字符向量化;S3、采用两层的双向LSTM作为序列标注模型,所述序列标注模型采用标注数据训练;S4、加入用户自定义词典;S5、使用维特比解码求出序列中的最大概率路径。本发明将预训练的语言模型的输出和第一层双向LSTM的输出作拼接,并作为第二层双向LSTM的输入可以减少标注语料的使用,同时在切换领域时可以只更换新领域的标注语料。另外,在预测的时候通过自定义词典的设置,可以更改进入维特比解码的发射矩阵,从而达到自定义词典的效果。
-
公开(公告)号:CN106021433B
公开(公告)日:2019-05-10
申请号:CN201610321688.2
申请日:2016-05-16
Applicant: 北京百分点信息科技有限公司
Abstract: 本发明实施例提供一种商品评论数据的口碑分析方法及装置,包括:接收输入的待分析商品评论数据,并对所述待分析商品评论数据进行分句处理;当判定所述待分析商品评论数据中具有匹配所述规则文件的规则的子句时,则根据匹配的规则提取所述待分析商品评论数据的属性词和评价词;其中,所述规则文件是将待训练商品评论数据的属性种子词和评价种子词输入Boostrapp i ng算法得到的;判断所述属性词是否存在属性树文件中,判断所述评价词是否存在评价文件中;当判定所述属性词存在所述属性树文件中且所述评价词存在所述评价词文件中时,从聚类映射文件中匹配所述属性词和评价词对应的口碑数据,获得目标口碑数据。
-
公开(公告)号:CN112396254A
公开(公告)日:2021-02-23
申请号:CN202011459957.4
申请日:2020-12-11
Applicant: 北京百分点信息科技有限公司
Abstract: 本公开涉及一种目的地预测方法、装置、介质及电子设备,所述方法包括:获取与目标车辆相关的目标特征信息,其中,所述目标特征信息包括当前随机特征信息、所述目标车辆的目标历史行为轨迹信息,所述当前随机特征信息包括当前节假日信息、当前通行时间信息、当前车辆限行信息、当前天气信息;将所述目标特征信息输入到目的地预测模型中,得到所述目的地预测模型输出的所述目标车辆的预测目的地信息。通过上述技术方案,由于目的地预测模型在进行预测时的特征信息更为全面,因此通过该目的地预测模型得出的预测目的地信息更为准确。
-
公开(公告)号:CN109447485B
公开(公告)日:2020-09-04
申请号:CN201811294029.X
申请日:2018-10-31
Applicant: 北京百分点信息科技有限公司
Abstract: 本发明公开了一种基于规则的实时决策系统及方法,系统主要包括Kafka平台、kudu数据库、hive数据库、原始数据输入模块、数据解析过滤模块、决策树配置模块、Zookeeper、决策树解析器、决策森林模块、连接池。通过本发明可以实时收集、监控用户的行为日志数据,根据营销场景需求,构建自动化营销场景规则树,连接用户线上和线下的行为,实时判断用户的标签、特征、行为,然后通过短信、邮件、APP推送消息等不同渠道实现对用户的精准触达,与用户的互动沟通,达到树立品牌形象或提升转化率的效果,实现精准营销的营销行为。
-
公开(公告)号:CN110929168A
公开(公告)日:2020-03-27
申请号:CN201911100324.1
申请日:2019-11-12
Applicant: 北京百分点信息科技有限公司
IPC: G06F16/9536 , G06Q50/00
Abstract: 本发明公开了一种关键受众确定方法、装置及电子设备,所述方法可以包括:基于目标话题的受众的发文数据和发文传播行为数据,构建目标话题的受众的社交网络,其中,所述社交网络的节点用于表示受众,所述节点的权重由所述节点代表的受众的发文数据确定,所述社交网络中第一节点到第二节点的有向边用于表示第一受众对第二受众的发文传播行为,所述有向边的权重由所述发文传播行为对应的发文传播行为数据确定;基于所述社交网络中节点的权重和有向边的权重,确定所述社交网络中的节点所代表的受众的重要性评估参数;基于所述目标话题的受众的重要性评估参数,确定所述目标话题的关键受众。本发明公开的方案可以提高确定出的关键受众的准确性。
-
公开(公告)号:CN110795476A
公开(公告)日:2020-02-14
申请号:CN201910985063.X
申请日:2019-10-16
Applicant: 北京百分点信息科技有限公司
IPC: G06F16/248 , G06F16/27 , G06F16/28
Abstract: 本申请公开了一种本体库的数据写入方法及装置,其中,该方法包括:基于本体配置信息,将至少一个外部数据源中的本体相关数据导入到列式存储的分布式数据库中,得到一个或多个本体实例的本体数据;其中,在分布式数据库中,来自不同外部数据源的相同本体实例的本体数据基于本体实例标识关联;基于本体实例标识将分布式数据库中存储的同一本体实例的本体数据进行聚合,并写入到本体库中。
-
公开(公告)号:CN110647547A
公开(公告)日:2020-01-03
申请号:CN201910895091.2
申请日:2019-09-20
Applicant: 北京百分点信息科技有限公司
IPC: G06F16/2455 , G06F16/2458
Abstract: 本说明书实施例公开了一种消费延迟监控方法、装置、电子设备及计算机可读存储介质。其中,该方法应用于基于Spark Streaming框架的流处理系统,包括:按照预设时间间隔从Kafka系统中读取流数据,所述流数据中包括多条携带有生产时间戳的业务数据;基于所述流数据中的目标业务数据的生产时间戳确定所述Kafka系统的消费延迟时间,其中,所述目标业务数据为所述流数据中生产时间戳最晚的业务数据;基于所述消费延迟时间,对所述Kafka系统进行消费延迟监控。本申请能够实现对Kafka系统中的消费延迟信息的有效监控。
-
公开(公告)号:CN110795458A
公开(公告)日:2020-02-14
申请号:CN201910950353.0
申请日:2019-10-08
Applicant: 北京百分点信息科技有限公司
IPC: G06F16/2455 , G06F16/248 , G06F9/451
Abstract: 本申请公开了一种交互式数据分析方法、装置、电子设备和计算机可读存储介质。其中,本申请基于用户在前端显示的可视化图表上执行的数据分析选择操作,确定用于数据检索的索引字段以及数据聚合类型;从预设的数据库中检索出与索引字段对应的待分析数据;根据数据聚合类型对该待分析数据进行数据聚合分析;将聚合分析结果展示在所述前端,从而实现基于可视化图表的交互式数据分析,提高数据分析效率。
-
公开(公告)号:CN110704871A
公开(公告)日:2020-01-17
申请号:CN201910900541.2
申请日:2019-09-23
Applicant: 北京百分点信息科技有限公司
IPC: G06F21/62
Abstract: 本发明公开了一种权限管理方法、装置、电子设备以及计算机可读存储介质。该方法包括:接收用户对多源融合数据的数据访问请求;获取所述用户请求访问的数据,其中所述数据包括至少一个属性值;确定所述用户对所述数据的数据源的权限;根据所述属性值的数据源标识和所述权限,确定用户对所述属性值的权限,并执行与所述属性值的权限对应的操作;其中所述数据源标识用于表征所述属性值的数据源。
-
公开(公告)号:CN108830402A
公开(公告)日:2018-11-16
申请号:CN201810426357.4
申请日:2018-05-07
Applicant: 北京百分点信息科技有限公司
Abstract: 本申请涉及计算机技术领域,尤其涉及一种人口预测方法及装置,用以解决现有技术中存在的人口预测的角度以及依赖的预测模型较为单一、扩展性较差的问题。主要包括:获取用于进行人口预测的指标数据,生成至少一项人口预测任务,从预设模型集合中,为至少一项人口预测任务中每个人口预测任务选取相应的预测模型,针对每个人口预测任务,基于选取的预测模型以及获取的指标数据进行人口预测。从而,避免现有技术中人口预测产品仅依赖单一预测模型进行人口预测的缺陷,可以从预设模型集合中的至少两种预测模型中选择相应的预测模型,支持使用多种预测模型,从而,提升人口预测产品的使用效率以及可扩展性。
-
-
-
-
-
-
-
-
-