-
公开(公告)号:CN116757183A
公开(公告)日:2023-09-15
申请号:CN202310769811.7
申请日:2023-06-27
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/205 , G06F40/258 , G06F16/31 , G06F40/289 , G06F16/951 , G06V30/10
Abstract: 本说明书实施例提供了项目信息处理方法及装置,其中,一种项目信息处理方法包括:根据对项目文档进行解析获得的项目信息确定各项目标题的标题结构,根据确定的标题结构和各项目标题下的文本块生成结构化项目信息,在结构化项目信息中提取服务关键词,并确定服务关键词对应的标准关键词的服务属性集合中各服务属性的属性参数,以基于属性参数生成项目配置信息并进行项目配置处理。
-
公开(公告)号:CN117407385A
公开(公告)日:2024-01-16
申请号:CN202311429528.6
申请日:2023-10-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/215 , G06F16/21
Abstract: 本说明书公开了一种数据采集方法、装置、存储介质及电子设备,其中,数据采集方法通过对比对应产品的产品条款文件等实质性内容,对产品进行查重,然后将重复产品合并去重。然后将去重后的产品信息,即去重产品信息,输入解析模型,由解析模型对去重产品信息进行解析,得到目标属性信息,最后将该目标属性信息录入数据库,即得到目标数据库。
-
公开(公告)号:CN116431762A
公开(公告)日:2023-07-14
申请号:CN202310247073.X
申请日:2023-03-08
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种文本生成模型训练及文本生成方法、装置以及存储介质。在各输出时间步计算样本输入序列中各字符的复制概率,以及在各输出时间步计算词表空间中各字符的生成概率;基于各字符在各输出时间步的复制概率和生成概率确定各输出时间步的样本输出字符,进而得到样本输入序列对应的样本输出序列;根据标准输出序列以及样本输出序列计算输出损失,训练文本生成模型。文本生成模型在训练过程中就学习到将输入序列中的重要字符复制到输出中以得到高可信的输出序列。
-
-