-
公开(公告)号:CN112256841B
公开(公告)日:2024-05-07
申请号:CN202011350754.1
申请日:2020-11-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33 , G06F40/279 , G06F40/30
Abstract: 本说明书实施例提供一种文本匹配和对抗文本识别方法、装置及设备。文本匹配方法包括:构建第一文本和第二文本的文本向量,并分析文本向量之间的对齐信息;从对齐信息中抽取出关键对齐信息,以保留文本中关键文本单元相关的对齐信息;基于第一文本和第二文本的文本向量、关键对齐信息,分析第一文本和第二文本的匹配关系,达到从文本样本的维度进行文本匹配分析的目的。
-
公开(公告)号:CN112256841A
公开(公告)日:2021-01-22
申请号:CN202011350754.1
申请日:2020-11-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33 , G06F40/279 , G06F40/30
Abstract: 本说明书实施例提供一种文本匹配和对抗文本识别方法、装置及设备。文本匹配方法包括:构建第一文本和第二文本的文本向量,并分析文本向量之间的对齐信息;从对齐信息中抽取出关键对齐信息,以保留文本中关键文本单元相关的对齐信息;基于第一文本和第二文本的文本向量、关键对齐信息,分析第一文本和第二文本的匹配关系,达到从文本样本的维度进行文本匹配分析的目的。
-
公开(公告)号:CN111581950A
公开(公告)日:2020-08-25
申请号:CN202010361585.5
申请日:2020-04-30
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书提供了同义名称词的确定方法和同义名称词的知识库的建立方法。在一个实施例中,同义名称词的确定方法通过先获取包含有目标对象的第一名称词的第一语料数据,以及与第一语料数据关联的第二语料数据;再通过根据预设的处理规则对上述语料数据进行基于自然语言理解的多组预设处理,得到处理后的语料数据;进而可以利用上述处理后的语料数据,通过确定并利用文本数据的正则表达式,以及文本数据与目标对象的第一名称词之间的关系参数这两种不同维度的参数数据,来挖掘确定出目标对象的同义名称词。从而能够有效地避免遗漏,较为准确、全面地挖掘出目标对象的同义名称词。
-
公开(公告)号:CN111401569B
公开(公告)日:2023-02-17
申请号:CN202010229223.0
申请日:2020-03-27
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种超参数优化方法、装置和电子设备的实施例。所述方法包括:利用以下步骤进行迭代处理,直至满足迭代结束条件:根据动作数据,调整超参数的当前取值,所述动作数据用于表示超参数取值的调整方向;根据超参数的调整后的取值,计算相应的性能指标,所述性能指标用于表示模型的性能;根据动作数据和性能指标,更新目标函数的代理模型,所述目标函数用于表示从动作数据到性能指标的映射关系;根据更新后的代理模型,确定新的动作数据;在迭代结束以后,将超参数的当前取值确定为优化取值。本说明书实施例的超参数优化方法、装置和电子设备,可以快速地获得超参数的优化取值,减少迭代次数。
-
公开(公告)号:CN111401569A
公开(公告)日:2020-07-10
申请号:CN202010229223.0
申请日:2020-03-27
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种超参数优化方法、装置和电子设备的实施例。所述方法包括:利用以下步骤进行迭代处理,直至满足迭代结束条件:根据动作数据,调整超参数的当前取值,所述动作数据用于表示超参数取值的调整方向;根据超参数的调整后的取值,计算相应的性能指标,所述性能指标用于表示模型的性能;根据动作数据和性能指标,更新目标函数的代理模型,所述目标函数用于表示从动作数据到性能指标的映射关系;根据更新后的代理模型,确定新的动作数据;在迭代结束以后,将超参数的当前取值确定为优化取值。本说明书实施例的超参数优化方法、装置和电子设备,可以快速地获得超参数的优化取值,减少迭代次数。
-
公开(公告)号:CN111581950B
公开(公告)日:2024-01-02
申请号:CN202010361585.5
申请日:2020-04-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/247 , G06F40/30 , G06F16/33 , G06F16/36 , G06Q10/0635 , G06Q40/04
Abstract: 为准确、全面地挖掘出目标对象的同义名称词。本说明书提供了同义名称词的确定方法和同义名称词的知识库的建立方法。在一个实施例中,同义名称词的确定方法通过先获取包含有目标对象的第一名称词的第一语料数据,以及与第一语料数据关联的第二语料数据;再通过根据预设的处理规则对上述语料数据进行基于自然语言理解的多组预设处理,得到处理后的语料数据;进而可以利用上述处理后的语料数据,通过确定并利用文本数据的正则表达式,以及文本数
-
公开(公告)号:CN111310456B
公开(公告)日:2023-06-20
申请号:CN202010090933.X
申请日:2020-02-13
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/284 , G06F40/295 , G06F40/30 , G06N3/048 , G06N3/0455 , G06N3/0464 , G06N3/0442 , G06N3/09 , G06N20/00 , G06Q40/04
Abstract: 本说明书实施例提供一种实体名称匹配方法、装置及设备。方案包括:获取待匹配实体名称;对待匹配实体名称进行分词,并将分词映射为向量,得到待匹配实体名称的词向量;采用基于自注意力机制的特征抽取器对每个词向量进行特征抽取,得到第一特征向量;再采用训练完成的条件随机场模型对第一特征向量进行序列标注,得到携带有域标签的第二特征向量,将第二特征向量输入到实体匹配模型中,得到匹配结果。
-
公开(公告)号:CN111711618A
公开(公告)日:2020-09-25
申请号:CN202010489800.X
申请日:2020-06-02
Applicant: 支付宝(杭州)信息技术有限公司
IPC: H04L29/06
Abstract: 本申请公开了一种风险地址识别方法、设备和装置,该方法包括:获取待识别地址数据;将所述待识别地址数据通过第一预设模型划分为多个字符组;确定划分后的每个字符组对应的词嵌入向量;将每个字符组对应的词嵌入向量输入风险地址识别网络模型,得到所述待识别地址数据是否为风险地址。
-
公开(公告)号:CN111310456A
公开(公告)日:2020-06-19
申请号:CN202010090933.X
申请日:2020-02-13
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/284 , G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08 , G06N20/00 , G06Q40/04
Abstract: 本说明书实施例提供一种实体名称匹配方法、装置及设备。方案包括:获取待匹配实体名称;对待匹配实体名称进行分词,并将分词映射为向量,得到待匹配实体名称的词向量;采用基于自注意力机制的特征抽取器对每个词向量进行特征抽取,得到第一特征向量;再采用训练完成的条件随机场模型对第一特征向量进行序列标注,得到携带有域标签的第二特征向量,将第二特征向量输入到实体匹配模型中,得到匹配结果。
-
-
-
-
-
-
-
-