-
公开(公告)号:CN111680203B
公开(公告)日:2023-04-18
申请号:CN202010378074.4
申请日:2020-05-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/951 , G06Q10/04 , G06Q10/0635
Abstract: 本说明书实施例公开了一种数据采集方法、装置和电子设备的实施例。所述方法包括:利用以下步骤进行迭代处理,直至满足预设条件:根据价值预测模型,从第一数据集中选取第一数据,所述第一数据集包括至少一个第一数据,所述第一数据由粗采集方式采集得到;根据选取的第一数据所对应的数据标识,利用精采集方式采集第二数据;根据选取的第一数据,获取数据标识对应的特征数据;根据采集的第二数据,确定数据标识对应的标签;根据标签和特征数据,对所述价值预测模型进行训练。本说明书实施例的数据采集方法、装置和电子设备,可以节省数据的采集成本。
-
公开(公告)号:CN111523995B
公开(公告)日:2023-03-17
申请号:CN202010312789.X
申请日:2020-04-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q40/02 , G06F16/21 , G06F16/2455 , G06F18/24
Abstract: 本说明书实施例公开了一种基于模型迁移的特征值确定方法、装置以及设备,方案包括:获取源场景数据集的基于第一特征维度的第一数据分箱的数据在所述源场景数据集中的占比信息;在目标场景数据集中基于所述第一特征维度确定与所述占比信息相匹配的第二数据分箱;获取所述第一数据分箱的数据在第二特征维度的特征值;将所述特征值确定为所述第二数据分箱的数据在所述第二特征维度的特征值。
-
公开(公告)号:CN111783126B
公开(公告)日:2022-04-29
申请号:CN202010706285.6
申请日:2020-07-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/60 , G06F21/62 , G06F16/903 , G06K9/62
Abstract: 本说明书实施例公开了一种隐私数据识别方法、装置、设备和可读介质。方案包括:获取第一数据集的第一长度分布向量和第一字符分布统计信息,所述第一数据集为隐私数据样本的集合;获取第二数据集的第二长度分布向量和第二字符分布统计信息,所述第二数据集为待识别字段对应的至少部分数据样本的集合;计算所述第一数据集与所述第二数据集的长度分布相似度、字符分布相似度,并基于所述长度分布相似度和字符分布相似度确定所述待识别字段对应的数据是否为与所述第一数据集同类型的隐私数据。
-
公开(公告)号:CN113366511B
公开(公告)日:2022-03-25
申请号:CN202080000848.8
申请日:2020-01-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/12
Abstract: 本文公开了使用遗传算法生成模式程序的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。遗传算法对表示将通过命名实体识别来识别或提取的数据类别的示例数据串进行运算。在初始化阶段,基于表示将通过命名实体识别来识别或提取的数据类别的示例数据串,生成初始模式程序。从初始模式程序开始,迭代地进行遗传运算以生成多代的后代模式程序。在每一轮遗传运算中,后代模式程序是通过交叉繁殖运算和变异运算生成的。
-
公开(公告)号:CN113849557A
公开(公告)日:2021-12-28
申请号:CN202110972339.8
申请日:2021-08-24
Applicant: 支付宝(杭州)信息技术有限公司 , 蚂蚁区块链科技(上海)有限公司
Abstract: 本说明书实施例提供了一种基于可信存证的借据上链方法和装置。该方法中,首先确定第一借据期数及第一借据金额;根据第一借据期数及第一借据金额,从各个待处理的借据中确定出待上链借据;调用可信存证服务接口,将所述待上链借据上传到区块链中;其中,所述第一借据期数及所述第一借据金额满足:在将根据该第一借据期数及第一借据金额确定出的所述待上链借据上传到区块链时,可信存证服务的业务增值大于预定值。本说明书实施例的方案能够降低可信存证服务的成本,并提高可信存证服务的业务增值。
-
公开(公告)号:CN113283232A
公开(公告)日:2021-08-20
申请号:CN202110601345.2
申请日:2021-05-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/205 , G06F40/211 , G06F40/289 , G06F21/62 , G06N3/04 , G06K9/62 , G06N3/08
Abstract: 本说明书实施例提供一种自动解析文本中隐私信息的方法和装置,方法包括:获取待解析文本;对所述待解析文本进行分词处理,得到包含若干个词语的词序列;对所述词序列进行基于上下文的编码,得到所述若干个词语分别对应的词向量;根据所述词向量,确定其对应的词语分别属于多个隐私信息类别的各概率;将所述各概率中最大概率对应的隐私信息类别确定为相应词语的归属类别;根据词语的归属类别和该词语在所述词序列中的位置,确定所述待解析文本的解析结果。能够提升文本的解析效果。
-
公开(公告)号:CN113220949A
公开(公告)日:2021-08-06
申请号:CN202110517500.2
申请日:2021-05-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/903 , G06F16/906 , G06F40/295 , G06F21/62
Abstract: 本说明书公开了一种隐私数据识别系统的构建方法及装置。该方法应用于隐私识别服务平台,隐私识别服务平台配置有多个隐私识别模块集合,不同的隐私识别模块集合具有不同的识别性能;各识别模块集合整体能够识别的隐私数据类型相同、任意识别模块集合内的不同模块分别用于识别不同类型的隐私数据;所述方法包括:接收目标需求方发送的识别系统构建请求;请求中包括:对隐私数据类型的识别需求、以及对识别性能的需求;从多个隐私识别模块集合中,选择与识别性能需求相匹配的模块集合;在所选择的模块集合中,选择与隐私数据类型的识别需求相匹配的一个或多个识别模块;基于所选择的模块,构建对应于目标需求方的隐私数据识别系统。
-
公开(公告)号:CN111553487B
公开(公告)日:2021-04-27
申请号:CN202010450303.9
申请日:2020-05-25
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06F16/903 , G06F16/35 , G06K9/62 , G06Q40/02
Abstract: 一种业务对象识别方法及装置,所述方法包括:将特征样本集中与业务对象相对应的业务特征输入预先训练的机器学习模型,以根据所述机器学习模型的输出结果确定所述业务特征对应的业务对象是否运营了预设业务;将运营了预设业务的业务对象添加至对象集,将运营了预设业务的业务对象对应的业务特征添加至数据集;在预设的舆情数据库中搜索与所述数据集中的业务特征相关的舆情数据,并从搜索到的舆情数据中提取业务特征,将提取出的所述业务特征添加至所述特征样本集,以对所述特征样本集进行更新;以及,确定与所述对象集中的各业务对象存在业务关系的扩展业务对象,并将确定出的所述扩展业务对象添加至所述对象集,以得到更新后的所述对象集。
-
公开(公告)号:CN112435105A
公开(公告)日:2021-03-02
申请号:CN202110110606.0
申请日:2021-01-27
Applicant: 支付宝(杭州)信息技术有限公司 , 蚂蚁区块链科技(上海)有限公司
Abstract: 本说明书实施例提供了一种基于区块链的租赁风险评估方法、装置、设备及系统,其中方法包括:从区块链系统中获取目标承租方所承租的目标租赁设备的运行数据;获取预先训练的对目标租赁设备的租赁业务进行风险评估的评估模型;利用获取的评估模型基于运行数据,对目标承租方在未来的预设时段内关于目标租赁设备的租赁业务进行风险评估处理,得到风险评估结果信息;其中,运行数据由设置于目标租赁设备中的物联网模块采集并上传至区块链系统。
-
公开(公告)号:CN112434167A
公开(公告)日:2021-03-02
申请号:CN202110100246.6
申请日:2021-01-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例提供了一种信息识别方法及装置,其中,该方法包括:获取待识别的多个目标文本信息;其中,该目标文本信息为针对历史事件所产生的文本信息文档;确定每个目标文本信息对应的文本分词关系图谱;其中,该文本分词关系图谱包括:文本分词节点和分词节点连接边;将确定出的文本分词关系图谱输入至预先训练好的神经网络模型,得到目标文本信息之间的信息关联程度;其中,该信息关联程度用于表征至少两个所述目标文本信息为针对同一历史事件所产生的文本信息文档的概率。
-
-
-
-
-
-
-
-
-