-
公开(公告)号:CN111353292B
公开(公告)日:2023-06-16
申请号:CN202010120906.2
申请日:2020-02-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/205 , G06F40/289 , G06F40/30 , G06F3/16 , G10L15/26
Abstract: 本说明书实施例提供一种针对用户操作指令的解析方法,该方法包括:先获取对用户输入语音进行识别得到的输入文本,并对其行分词处理,得到分词序列;再将该分词序列中,与商品描述相关的若干分词分别转化为预定格式的标记符,得到混合序列;再获取预先设定的语义模板集,其中每个语义模板包括多个语义描述符的预定组合排列,且对应于一种操作类型,多个语义描述符包括对应于标记符的组合的商品描述符;再基于语义模板集,对初始为混合序列的当前序列进行循环解析;其中任意一次循环解析包括,从当前序列头部开始,截取出与某个语义模板匹配的序列部分,根据该某个语义模板对应的操作类型和该序列部分中的标记符,得到操作指令,并更新当前序列。
-
公开(公告)号:CN113220885B
公开(公告)日:2023-02-07
申请号:CN202110562028.4
申请日:2021-05-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06F40/205 , G06F40/30
Abstract: 本说明书实施例公开了一种文本处理方法和系统。其中,该方法包括:获取目标文本;目标文本包含多条语句;基于目标文本,通过第一预测模型确定目标文本中的一条或多条目标语句关联的对象;基于一条或多条目标语句通过第二预测模型,确定各目标语句对其关联的对象的描述观点;基于各目标语句对其关联的对象的描述观点,确定目标文本对一个或多个对象的描述结论。
-
公开(公告)号:CN111399910B
公开(公告)日:2022-06-07
申请号:CN202010172526.3
申请日:2020-03-12
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种用户指令的处理方法,该方法的执行主体为客户端。该方法包括:首先,响应于用户发出的在第一服务中创建会话的指令,创建第一会话;接着,响应于开始采集用户输入的语音信号,生成待分配的语音指令编号;然后,从服务端获取利用所述语音信号解析出的语音操作指令,并将所述语音指令编号分配给所述语音操作指令;再接着,获取第一指令编号,对应于所述第一会话中最新执行的第一操作指令;再然后,判断所述语音指令编号相对于所述第一指令编号,是否为在先生成编号;最后,在判断出是在先生成编号的情况下,舍弃所述语音操作指令。如此,可以实现对用户指令的冲突管理。
-
公开(公告)号:CN111399910A
公开(公告)日:2020-07-10
申请号:CN202010172526.3
申请日:2020-03-12
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种用户指令的处理方法,该方法的执行主体为客户端。该方法包括:首先,响应于用户发出的在第一服务中创建会话的指令,创建第一会话;接着,响应于开始采集用户输入的语音信号,生成待分配的语音指令编号;然后,从服务端获取利用所述语音信号解析出的语音操作指令,并将所述语音指令编号分配给所述语音操作指令;再接着,获取第一指令编号,对应于所述第一会话中最新执行的第一操作指令;再然后,判断所述语音指令编号相对于所述第一指令编号,是否为在先生成编号;最后,在判断出是在先生成编号的情况下,舍弃所述语音操作指令。如此,可以实现对用户指令的冲突管理。
-
公开(公告)号:CN111161711A
公开(公告)日:2020-05-15
申请号:CN202010251523.9
申请日:2020-04-01
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种对流式语音识别文本进行断句的方法,该方法包括:首先,响应于客户端发送的在第一服务中开始第一会话的通知,持续接收客户端采集的针对该第一会话的流式语音信号;接着,对流式语音信号进行流式语音识别,得到各个时刻下的识别文本;其中在各个时刻下,针对该时刻下的识别文本进行断句判断,具体包括:先将当前时刻下的当前识别文本,与已有语义文本进行比对,得到增量文本,其中已有语义文本是对当前时刻之前的识别文本进行断句而形成的语义片段序列;接着基于与第一服务对应的多个关键词,对该增量文本进行匹配,得到匹配词集合,以确定文本特征;然后,至少基于该文本特征,判断是否在当前识别文本后进行断句。
-
公开(公告)号:CN111161711B
公开(公告)日:2020-07-03
申请号:CN202010251523.9
申请日:2020-04-01
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种对流式语音识别文本进行断句的方法,该方法包括:首先,响应于客户端发送的在第一服务中开始第一会话的通知,持续接收客户端采集的针对该第一会话的流式语音信号;接着,对流式语音信号进行流式语音识别,得到各个时刻下的识别文本;其中在各个时刻下,针对该时刻下的识别文本进行断句判断,具体包括:先将当前时刻下的当前识别文本,与已有语义文本进行比对,得到增量文本,其中已有语义文本是对当前时刻之前的识别文本进行断句而形成的语义片段序列;接着基于与第一服务对应的多个关键词,对该增量文本进行匹配,得到匹配词集合,以确定文本特征;然后,至少基于该文本特征,判断是否在当前识别文本后进行断句。
-
公开(公告)号:CN115345178A
公开(公告)日:2022-11-15
申请号:CN202210917683.1
申请日:2022-08-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/35 , G06F16/332
Abstract: 本说明书实施例提供一种对话标注数据的生成方法及装置。其中方法包括:获取目标场景下预先生成的形式文法,其中至少包括第一语句和第二语句,第一语句包括第一意图下的第一意图操作和第一变量,所述第一变量是需调用其他语句的变量;第二语句用于为所述第一变量赋值,并包括属性获取操作和第二意图下的第二变量;通过至少调用形式文法中的第一语句和第二语句,生成用于模拟某次人机对话的目标语义表达式,其以嵌套语句形式示出,将第二变量的对应于所述第一变量的属性值,赋值给所述第一变量并进行第一意图操作;基于目标语义表达式,生成对话标注数据,其中包括与构成某次人机对话的若干轮对话对应的若干个用户会话‑语义表达式标签组。
-
公开(公告)号:CN113220885A
公开(公告)日:2021-08-06
申请号:CN202110562028.4
申请日:2021-05-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06F40/205 , G06F40/30
Abstract: 本说明书实施例公开了一种文本处理方法和系统。其中,该方法包括:获取目标文本;目标文本包含多条语句;基于目标文本,通过第一预测模型确定目标文本中的一条或多条目标语句关联的对象;基于一条或多条目标语句通过第二预测模型,确定各目标语句对其关联的对象的描述观点;基于各目标语句对其关联的对象的描述观点,确定目标文本对一个或多个对象的描述结论。
-
公开(公告)号:CN111353292A
公开(公告)日:2020-06-30
申请号:CN202010120906.2
申请日:2020-02-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/205 , G06F40/289 , G06F40/30 , G06F3/16 , G10L15/26
Abstract: 本说明书实施例提供一种针对用户操作指令的解析方法,该方法包括:先获取对用户输入语音进行识别得到的输入文本,并对其行分词处理,得到分词序列;再将该分词序列中,与商品描述相关的若干分词分别转化为预定格式的标记符,得到混合序列;再获取预先设定的语义模板集,其中每个语义模板包括多个语义描述符的预定组合排列,且对应于一种操作类型,多个语义描述符包括对应于标记符的组合的商品描述符;再基于语义模板集,对初始为混合序列的当前序列进行循环解析;其中任意一次循环解析包括,从当前序列头部开始,截取出与某个语义模板匹配的序列部分,根据该某个语义模板对应的操作类型和该序列部分中的标记符,得到操作指令,并更新当前序列。
-
-
-
-
-
-
-
-