Patent search ap:("中移(杭州)信息技术有限公司" OR "中国移动通信集团有限公司") AND inv:"康凯凯" Page 1

1.

发明公开
语音交互方法及装置审中-实审

公开(公告)号：CN117219082A

公开(公告)日：2023-12-12

申请号：CN202311003782.X

申请日：2023-08-09

Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司

Inventor： 单权强 , 晁会勇 , 康凯凯

IPC: G10L15/26 , G10L15/18

Abstract: 本申请涉及语音交互领域，提供一种语音交互方法及装置。所述方法包括：接收用户语音输入；对用户语音输入进行语音识别，得到识别文本；基于有向无环图按照句式模板对多个字段进行逐字识别，在结束有向无环图的字段识别的情况下，得到语义理解结果；其中，句式模板包括多个槽位，每个槽位对应一类字段，每个槽位包括至少一个关键词，有向无环图包括开始节点，多个中间节点和结束节点，每个中间节点关联一个槽位。本申请提供的语音交互方法能够在语音解析流程结束时仅输出一个语义理解结果，减少了因对信息相同的识别结果进行重复解析而造成的计算资源浪费，提高了语音解析效率，进而提高了语音交互的响应速度。

2.

发明公开
一种融合用户特征的语义理解方法、装置及电子设备审中-实审

公开(公告)号：CN116913263A

公开(公告)日：2023-10-20

申请号：CN202310940229.2

申请日：2023-07-28

Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司

Inventor： 单权强 , 章翔 , 康凯凯 , 祁超

IPC: G10L15/18 , G10L15/16 , G10L15/22 , G10L17/06 , G06F16/432 , G06F16/435 , G06F40/35 , G06N3/0455

Abstract: 本发明涉及语义识别领域，提供一种融合用户特征的语义理解方法、装置及电子设备。方法包括：获取待处理文本，将待处理文本输入语义理解模型，基于语义理解模型对待处理文本进行第一次语义理解，得到初始语义理解结果；根据初始语义理解结果判断是否需要进行第二次语义理解；若确定需要进行第二次语义理解，则根据初始语义理解结果获取媒资信息，根据媒资信息获取媒资的内容热度特征和目标用户的用户特征；将内容热度特征和用户特征输入语义理解模型进行处理，并结合初始语义理解结果得到最终语义理解结果。本发明提供的一种融合用户特征的语义理解方法可以解决一般语义理解模型无法针对模糊文本输出一个准确的识别结果的问题。

3.

发明公开
命令词识别方法、装置、设备及存储介质审中-实审

公开(公告)号：CN117409770A

公开(公告)日：2024-01-16

申请号：CN202310934276.6

申请日：2023-07-27

Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司

Inventor： 蔡旭浦 , 荣玉军 , 梁莹 , 康凯凯 , 彭朋

IPC: G10L15/16 , G10L15/02 , G10L19/00

Abstract: 本申请涉及语音识别技术领域，提供一种命令词识别方法、装置、设备及存储介质。所述方法包括获取待识别的语音信息，并提取所述语音信息的音频特征；对所述音频特征进行压缩处理，并将压缩后的音频特征输入到经过预训练的命令词识别模型中，对所述语音信息中的命令词进行识别。本申请实施例提供的命令词识别方法，通过对音频特征进行压缩，可以剔除音频特征中的静音片段等无效信息，将压缩后的音频特征输入到经过预训练的命令词识别模型，对语音信息中的命令词进行识别时，可以避免或减少数据填充，从而减少计算资源的浪费。

4.

发明公开
文本改写方法、语音交互方法、装置及电子设备审中-实审

公开(公告)号：CN116956859A

公开(公告)日：2023-10-27

申请号：CN202310915243.7

申请日：2023-07-24

Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司

Inventor： 章翔 , 单权强 , 顾孙炎 , 康凯凯 , 潘益民

IPC: G06F40/186 , G06F40/216 , G06F40/284 , G06F40/295 , G06F40/30 , G06F16/35 , G10L15/26

Abstract: 本发明提供一种文本改写方法、语音交互方法、装置及电子设备，其中方法包括：获取待改写文本，识别待改写文本中的命名实体，并确定命名实体在待改写文本中的位置信息；将位置信息和待改写文本输入至语言模型中，由语言模型得到并输出待改写文本的第一改写文本；将位置信息和待改写文本输入至图网络中，由图网络得到并输出第二改写文本；分别确定第一改写文本和第二改写文本的困惑度，将困惑度最低的改写文本确定为待改写文本的目标改写文本。此过程结合命名实体的位置信息，并基于双路连续重复文本合并的方法，计算不同通道改写后文本的语义流畅度获取最优改写文本，更好地避免对命名实体的错误改写，提高目标改写文本的准确性和可靠性。

5.

发明公开
多任务语义理解方法、装置、电子设备和存储介质审中-实审

公开(公告)号：CN116933796A

公开(公告)日：2023-10-24

申请号：CN202310883789.9

申请日：2023-07-18

Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司

Inventor： 单权强 , 康凯凯 , 吴嘉琦

IPC: G06F40/30 , G06F40/284 , G06F40/205

Abstract: 本申请涉及自然语言处理技术领域，提供了一种多任务语义理解方法、装置、电子设备和存储介质，包括获取待理解的文本；将文本输入至预先确定的多任务语义理解模型，得到多任务语义理解模型输出的理解结果，理解结果包括领域信息、意图信息和词槽信息，领域信息用于确定领域限定向量，领域限定向量用于限定意图信息和词槽信息的领域。本申请使用领域限制向量对意图和词槽的识别任务做领域内的限制，使得意图和词槽的识别结果限制在相应的单一领域内，能够规避识别的意图结果、词槽结果与领域结果不符的情况，进而提升多任务联合模型的识别准确率。

Patent Agency Ranking