数据采集方法、装置和电子设备

    公开(公告)号:CN111680203B

    公开(公告)日:2023-04-18

    申请号:CN202010378074.4

    申请日:2020-05-07

    Inventor: 朱标 章鹏 崔阳

    Abstract: 本说明书实施例公开了一种数据采集方法、装置和电子设备的实施例。所述方法包括:利用以下步骤进行迭代处理,直至满足预设条件:根据价值预测模型,从第一数据集中选取第一数据,所述第一数据集包括至少一个第一数据,所述第一数据由粗采集方式采集得到;根据选取的第一数据所对应的数据标识,利用精采集方式采集第二数据;根据选取的第一数据,获取数据标识对应的特征数据;根据采集的第二数据,确定数据标识对应的标签;根据标签和特征数据,对所述价值预测模型进行训练。本说明书实施例的数据采集方法、装置和电子设备,可以节省数据的采集成本。

    一种隐私数据识别方法、装置、设备和可读介质

    公开(公告)号:CN111783126B

    公开(公告)日:2022-04-29

    申请号:CN202010706285.6

    申请日:2020-07-21

    Abstract: 本说明书实施例公开了一种隐私数据识别方法、装置、设备和可读介质。方案包括:获取第一数据集的第一长度分布向量和第一字符分布统计信息,所述第一数据集为隐私数据样本的集合;获取第二数据集的第二长度分布向量和第二字符分布统计信息,所述第二数据集为待识别字段对应的至少部分数据样本的集合;计算所述第一数据集与所述第二数据集的长度分布相似度、字符分布相似度,并基于所述长度分布相似度和字符分布相似度确定所述待识别字段对应的数据是否为与所述第一数据集同类型的隐私数据。

    利用遗传编程的命名实体识别和提取

    公开(公告)号:CN113366511B

    公开(公告)日:2022-03-25

    申请号:CN202080000848.8

    申请日:2020-01-07

    Abstract: 本文公开了使用遗传算法生成模式程序的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。遗传算法对表示将通过命名实体识别来识别或提取的数据类别的示例数据串进行运算。在初始化阶段,基于表示将通过命名实体识别来识别或提取的数据类别的示例数据串,生成初始模式程序。从初始模式程序开始,迭代地进行遗传运算以生成多代的后代模式程序。在每一轮遗传运算中,后代模式程序是通过交叉繁殖运算和变异运算生成的。

    基于可信存证的借据上链方法和装置

    公开(公告)号:CN113849557A

    公开(公告)日:2021-12-28

    申请号:CN202110972339.8

    申请日:2021-08-24

    Abstract: 本说明书实施例提供了一种基于可信存证的借据上链方法和装置。该方法中,首先确定第一借据期数及第一借据金额;根据第一借据期数及第一借据金额,从各个待处理的借据中确定出待上链借据;调用可信存证服务接口,将所述待上链借据上传到区块链中;其中,所述第一借据期数及所述第一借据金额满足:在将根据该第一借据期数及第一借据金额确定出的所述待上链借据上传到区块链时,可信存证服务的业务增值大于预定值。本说明书实施例的方案能够降低可信存证服务的成本,并提高可信存证服务的业务增值。

    一种隐私数据识别系统的构建方法及装置

    公开(公告)号:CN113220949A

    公开(公告)日:2021-08-06

    申请号:CN202110517500.2

    申请日:2021-05-12

    Abstract: 本说明书公开了一种隐私数据识别系统的构建方法及装置。该方法应用于隐私识别服务平台,隐私识别服务平台配置有多个隐私识别模块集合,不同的隐私识别模块集合具有不同的识别性能;各识别模块集合整体能够识别的隐私数据类型相同、任意识别模块集合内的不同模块分别用于识别不同类型的隐私数据;所述方法包括:接收目标需求方发送的识别系统构建请求;请求中包括:对隐私数据类型的识别需求、以及对识别性能的需求;从多个隐私识别模块集合中,选择与识别性能需求相匹配的模块集合;在所选择的模块集合中,选择与隐私数据类型的识别需求相匹配的一个或多个识别模块;基于所选择的模块,构建对应于目标需求方的隐私数据识别系统。

    一种业务对象识别方法及装置

    公开(公告)号:CN111553487B

    公开(公告)日:2021-04-27

    申请号:CN202010450303.9

    申请日:2020-05-25

    Inventor: 朱标 章鹏 崔阳

    Abstract: 一种业务对象识别方法及装置,所述方法包括:将特征样本集中与业务对象相对应的业务特征输入预先训练的机器学习模型,以根据所述机器学习模型的输出结果确定所述业务特征对应的业务对象是否运营了预设业务;将运营了预设业务的业务对象添加至对象集,将运营了预设业务的业务对象对应的业务特征添加至数据集;在预设的舆情数据库中搜索与所述数据集中的业务特征相关的舆情数据,并从搜索到的舆情数据中提取业务特征,将提取出的所述业务特征添加至所述特征样本集,以对所述特征样本集进行更新;以及,确定与所述对象集中的各业务对象存在业务关系的扩展业务对象,并将确定出的所述扩展业务对象添加至所述对象集,以得到更新后的所述对象集。

    一种信息识别方法及装置

    公开(公告)号:CN112434167A

    公开(公告)日:2021-03-02

    申请号:CN202110100246.6

    申请日:2021-01-26

    Abstract: 本说明书一个或多个实施例提供了一种信息识别方法及装置,其中,该方法包括:获取待识别的多个目标文本信息;其中,该目标文本信息为针对历史事件所产生的文本信息文档;确定每个目标文本信息对应的文本分词关系图谱;其中,该文本分词关系图谱包括:文本分词节点和分词节点连接边;将确定出的文本分词关系图谱输入至预先训练好的神经网络模型,得到目标文本信息之间的信息关联程度;其中,该信息关联程度用于表征至少两个所述目标文本信息为针对同一历史事件所产生的文本信息文档的概率。

Patent Agency Ranking