-
公开(公告)号:CN116757187A
公开(公告)日:2023-09-15
申请号:CN202310613874.3
申请日:2023-05-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/279 , G06F40/247 , G06F16/332 , G06Q10/0635 , G06N3/0464 , G06N3/0455 , G06N3/047 , G06N3/082 , G06N3/096
Abstract: 本说明书实施例公开了一种实体的检测方法、装置及设备,该方法包括:分别获取针对待比较的两个对象的属性信息和两个对象之间的空间距离信息,该属性信息通过文本信息的形式呈现;将两个对象的属性信息进行拼接,得到拼接文本信息,基于拼接文本信息,通过预先训练的目标语言模型,确定两个对象之间的属性相似度信息,其中,目标语言模型基于对象样本的样本属性信息构建的拼接文本样本和针对拼接文本样本构建的针对目标语言模型中每个网络层的输入数据中的提示信息进行模型训练后得到;基于两个对象之间的空间距离信息,确定两个对象之间的地理空间相似度信息;基于属性相似度信息和地理空间相似度信息,确定两个对象是否为同一实体。
-
公开(公告)号:CN115952333A
公开(公告)日:2023-04-11
申请号:CN202310108519.0
申请日:2023-01-18
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9032 , G06F16/903 , G06F18/213 , G06N3/088 , G06F16/9038 , G06Q40/03
Abstract: 本公开涉及一种结合文本表征的召回方法和系统。该方法包括:获取与商户相关的文本信息,所述文本信息包括与商户相关的商户名称、商户地址、WiFi文本名称中的至少一者;将所述文本信息转换成第一向量;基于所述第一向量来确定属于同一实体的候选商户对;以及对候选商户对进行打分和排序以输出属于同一实体的商户对。
-
公开(公告)号:CN118366171A
公开(公告)日:2024-07-19
申请号:CN202410473501.5
申请日:2024-04-18
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/19 , G06V30/146 , G06V30/18 , G06N20/00
Abstract: 本说明书实施例公开了一种凭证图像解析模型的训练方法、装置及电子设备,该训练方法包括:获取多个凭证图像和与各凭证图像对应的文本信息,根据多个凭证图像和对应的文本信息对待训练凭证图像解析模型进行光学字符识别OCR训练;基于语言模型和图像渲染模型生成包含各种凭证类型的多个凭证图像‑文本对,获取各凭证图像中各字段对应的位置框信息;根据各凭证图像‑文本对和与凭证图像对应的位置框信息对OCR训练后的待训练凭证图像解析模型进行再训练,以获取用于解析各类凭证的凭证图像解析模型。
-
-