-
公开(公告)号:CN113657112A
公开(公告)日:2021-11-16
申请号:CN202110949956.6
申请日:2021-08-18
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/295 , G06F40/211 , G06F40/30 , G06K9/62
Abstract: 本说明书实施例提供解读文章的方法以及装置,其中所述解读文章的方法包括:从文章中,根据用于描述文章的多种实体类型,提取出对应的多个实体;利用提取出的多个实体以及文章的文本进行关系抽取,得到实体之间的关联关系;基于实体之间的关联关系,构建出用于描述所述文章的多元组森林,所述多元组森林包括以实体作为节点、以实体间关联关系作为边的一个或多个树形结构;将所述多元组森林输入解读规则引擎,得到解读结果。该方法针对文章文本的复杂性,将文章文本结构化为多元组森林,由多元组森林准确完整地描述文章内容,再将多元组森林输入基于多元组森林结构构建的解读规则引擎进行解读,能够准确地得到解读结果,实现准确高效的文章解读。
-
公开(公告)号:CN114638217A
公开(公告)日:2022-06-17
申请号:CN202210246775.1
申请日:2022-03-14
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/279 , G06F16/33 , G06N5/02
Abstract: 本说明书实施例提供了地址文本处理方法及装置,其中,一种地址文本处理方法包括:获取对语音数据进行识别获得的地址文本,对所述地址文本进行切分处理获得地址关键词;对所述地址关键词进行层级标注,并基于层级标注结果搜索与所述地址关键词匹配的标准地址关键词;根据所述地址文本、所述地址关键词以及所述标准地址关键词,构建地址层级关系图;利用所述地址层级关系图计算所述地址关键词以及处于各候选地址链路的所述标准地址关键词的权重,并根据所述权重计算所述各候选地址链路的链路权重;根据所述各候选地址链路的链路权重确定所述地址文本对应的目标地址链路。
-
公开(公告)号:CN113468891A
公开(公告)日:2021-10-01
申请号:CN202110853255.2
申请日:2021-07-27
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/295 , G06F40/284 , G06F40/30 , G06F16/36
Abstract: 本说明书实施例提供文本处理方法以及装置,其中所述文本处理方法包括:接收待处理文本,将所述待处理文本输入实体识别模型,获得带有实体识别标签的候选文本;将所述带有实体识别标签的候选文本输入实体判别模型,获得所述候选文本的候选实体,并基于所述候选实体确定备选文本;基于所述候选实体与所述备选文本构建关系知识图,基于所述关系知识图计算每个关系知识图节点之间的相似度,确定目标实体关系;基于所述目标实体关系在预设知识库中,确定目标实体文本。
-
-