一种半监督学习结合自定义词典的命名实体识别方法

    公开(公告)号:CN109858041A

    公开(公告)日:2019-06-07

    申请号:CN201910172675.7

    申请日:2019-03-07

    Abstract: 本发明公开了一种半监督学习结合自定义词典的命名实体识别方法,包括如下步骤:S1、用未标注数据预训练Bi-LSTM语言模型;S2、在Embedding层采用字向量模型将每个字符向量化;S3、采用两层的双向LSTM作为序列标注模型,所述序列标注模型采用标注数据训练;S4、加入用户自定义词典;S5、使用维特比解码求出序列中的最大概率路径。本发明将预训练的语言模型的输出和第一层双向LSTM的输出作拼接,并作为第二层双向LSTM的输入可以减少标注语料的使用,同时在切换领域时可以只更换新领域的标注语料。另外,在预测的时候通过自定义词典的设置,可以更改进入维特比解码的发射矩阵,从而达到自定义词典的效果。

    一种商品评论数据的口碑分析方法和装置

    公开(公告)号:CN106021433B

    公开(公告)日:2019-05-10

    申请号:CN201610321688.2

    申请日:2016-05-16

    Abstract: 本发明实施例提供一种商品评论数据的口碑分析方法及装置,包括:接收输入的待分析商品评论数据,并对所述待分析商品评论数据进行分句处理;当判定所述待分析商品评论数据中具有匹配所述规则文件的规则的子句时,则根据匹配的规则提取所述待分析商品评论数据的属性词和评价词;其中,所述规则文件是将待训练商品评论数据的属性种子词和评价种子词输入Boostrapp i ng算法得到的;判断所述属性词是否存在属性树文件中,判断所述评价词是否存在评价文件中;当判定所述属性词存在所述属性树文件中且所述评价词存在所述评价词文件中时,从聚类映射文件中匹配所述属性词和评价词对应的口碑数据,获得目标口碑数据。

    一种基于规则的实时决策系统及方法

    公开(公告)号:CN109447485B

    公开(公告)日:2020-09-04

    申请号:CN201811294029.X

    申请日:2018-10-31

    Abstract: 本发明公开了一种基于规则的实时决策系统及方法,系统主要包括Kafka平台、kudu数据库、hive数据库、原始数据输入模块、数据解析过滤模块、决策树配置模块、Zookeeper、决策树解析器、决策森林模块、连接池。通过本发明可以实时收集、监控用户的行为日志数据,根据营销场景需求,构建自动化营销场景规则树,连接用户线上和线下的行为,实时判断用户的标签、特征、行为,然后通过短信、邮件、APP推送消息等不同渠道实现对用户的精准触达,与用户的互动沟通,达到树立品牌形象或提升转化率的效果,实现精准营销的营销行为。

    关键受众确定方法、装置及电子设备

    公开(公告)号:CN110929168A

    公开(公告)日:2020-03-27

    申请号:CN201911100324.1

    申请日:2019-11-12

    Abstract: 本发明公开了一种关键受众确定方法、装置及电子设备,所述方法可以包括:基于目标话题的受众的发文数据和发文传播行为数据,构建目标话题的受众的社交网络,其中,所述社交网络的节点用于表示受众,所述节点的权重由所述节点代表的受众的发文数据确定,所述社交网络中第一节点到第二节点的有向边用于表示第一受众对第二受众的发文传播行为,所述有向边的权重由所述发文传播行为对应的发文传播行为数据确定;基于所述社交网络中节点的权重和有向边的权重,确定所述社交网络中的节点所代表的受众的重要性评估参数;基于所述目标话题的受众的重要性评估参数,确定所述目标话题的关键受众。本发明公开的方案可以提高确定出的关键受众的准确性。

    一种本体库的数据写入方法及装置

    公开(公告)号:CN110795476A

    公开(公告)日:2020-02-14

    申请号:CN201910985063.X

    申请日:2019-10-16

    Abstract: 本申请公开了一种本体库的数据写入方法及装置,其中,该方法包括:基于本体配置信息,将至少一个外部数据源中的本体相关数据导入到列式存储的分布式数据库中,得到一个或多个本体实例的本体数据;其中,在分布式数据库中,来自不同外部数据源的相同本体实例的本体数据基于本体实例标识关联;基于本体实例标识将分布式数据库中存储的同一本体实例的本体数据进行聚合,并写入到本体库中。

    一种权限管理方法及装置

    公开(公告)号:CN110704871A

    公开(公告)日:2020-01-17

    申请号:CN201910900541.2

    申请日:2019-09-23

    Abstract: 本发明公开了一种权限管理方法、装置、电子设备以及计算机可读存储介质。该方法包括:接收用户对多源融合数据的数据访问请求;获取所述用户请求访问的数据,其中所述数据包括至少一个属性值;确定所述用户对所述数据的数据源的权限;根据所述属性值的数据源标识和所述权限,确定用户对所述属性值的权限,并执行与所述属性值的权限对应的操作;其中所述数据源标识用于表征所述属性值的数据源。

    一种人口预测方法及装置
    10.
    发明公开

    公开(公告)号:CN108830402A

    公开(公告)日:2018-11-16

    申请号:CN201810426357.4

    申请日:2018-05-07

    Abstract: 本申请涉及计算机技术领域,尤其涉及一种人口预测方法及装置,用以解决现有技术中存在的人口预测的角度以及依赖的预测模型较为单一、扩展性较差的问题。主要包括:获取用于进行人口预测的指标数据,生成至少一项人口预测任务,从预设模型集合中,为至少一项人口预测任务中每个人口预测任务选取相应的预测模型,针对每个人口预测任务,基于选取的预测模型以及获取的指标数据进行人口预测。从而,避免现有技术中人口预测产品仅依赖单一预测模型进行人口预测的缺陷,可以从预设模型集合中的至少两种预测模型中选择相应的预测模型,支持使用多种预测模型,从而,提升人口预测产品的使用效率以及可扩展性。

Patent Agency Ranking