-
公开(公告)号:CN117037791A
公开(公告)日:2023-11-10
申请号:CN202211565299.6
申请日:2022-12-07
Applicant: 科大讯飞股份有限公司 , 广州市讯飞樽鸿信息技术有限公司
Abstract: 本申请提供了一种基于语音识别的数据处理方法、装置、设备和存储介质,所述方法通过获取目标语音,通过语音转写模型对目标语音进行转写,生成文字文本,对文字文本的语篇结构及谈论对象进行抽取,通过错误检出模型对文字文本进行检测,根据抽取结果及检测结果,判断文字文本是否存在错误数据,提高文字文本中错误数据识别的准确率,从而提高语音识别准确率。
-
公开(公告)号:CN115455982A
公开(公告)日:2022-12-09
申请号:CN202210995846.8
申请日:2022-08-17
Applicant: 科大讯飞股份有限公司 , 联通在线信息科技有限公司 , 广州市讯飞樽鸿信息技术有限公司
Abstract: 本申请提出一种对话处理方法、装置、电子设备及存储介质,方法包括:至少基于当前对话文本预测得到当前对话文本对应的第一语义信息;其中,第一语义信息包括:领域信息、意图信息和语义槽信息;根据预先构建的对话知识图谱,对第一语义信息以及历史对话语义信息进行语义信息融合,得到第二语义信息,其中,历史对话语义信息为根据历史对话文本而确定的语义信息;根据第二语义信息,确定与第二语义信息对应的对话提示信息。采用本方案,对当前对话文本对应的第一语义信息以及历史对话文本对应的语义信息进行融合,可以实现对话状态追踪,准确把握各个对话之间依赖关系,从而能够确定更加准确的有益信息,因此能够提高对话管理的准确度。
-
公开(公告)号:CN118246412A
公开(公告)日:2024-06-25
申请号:CN202410349084.3
申请日:2024-03-26
Applicant: 科大讯飞(北京)有限公司 , 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院
IPC: G06F40/166 , G06F40/232 , G06F40/284 , G06N20/00
Abstract: 本申请公开了一种文本润色训练数据筛选方法、装置、相关设备及计算机程序产品,本申请在获取到文本润色任务数据集后,调用人工智能大模型,通过第一提示指令prompt指示大模型结合给定的评测标准对每条润色任务进行评测,给出评测结果,借助大模型的能力可以更加准确的得到每条润色任务的质量评测结果,与人类专家给出的评测结果更加接近,可以节省大量人力并避免由于主观偏见造成的评测结果波动。在此基础上,可以筛选出满足设定评测结果要求的润色任务作为最终的润色训练数据,得到高质量的润色训练数据。以筛选得到的高质量的润色训练数据训练处理文本润色任务的模型时,可以提升模型的训练效果。
-
公开(公告)号:CN117973369A
公开(公告)日:2024-05-03
申请号:CN202410153454.6
申请日:2024-02-02
Applicant: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司
IPC: G06F40/232 , G06F40/284 , G06F40/242 , G06F18/214 , G06F18/213 , G06F18/2411 , G06F18/25
Abstract: 本申请公开了一种文本纠错方法、装置、相关设备及计算机程序产品,本申请分别采用通用词典和目标领域的专业词典对待纠错文本进行分词,得到第一分词结果和第二分词结果,由第一分词结果确定通用词典向量,由第二分词结果确定专业词典向量,对两种词典向量进行融合,基于融合向量确定待纠错文本对应的纠错后文本。通用词典向量涵盖了待纠错文本中可能存在的一般性错误信息,专业词典向量涵盖了待纠错文本中可能存在的目标领域下专业词汇的拼写错误信息,基于融合向量确定待纠错文本的纠错后文本,保证了本申请方案对常见的一般性错误的纠错能力,以及对特定垂类领域的专业词汇的拼写错误的纠错能力,大大提升了文本纠错效果。
-
公开(公告)号:CN116628183A
公开(公告)日:2023-08-22
申请号:CN202310460603.9
申请日:2023-04-25
Applicant: 科大讯飞股份有限公司
IPC: G06F16/34 , G06F16/335 , G06F16/338
Abstract: 本申请公开了一种目标提纲生成方法、系统及相关装置,该方法包括:获取到用户输入的第一需求,基于所述第一需求,生成根层级对应的至少一个标题;响应于获取到用户输入的第二需求,基于所述第二需求和至少部分已生成的标题,至少生成当前层级对应的下一层级的标题,直至得到所有层级的标题组成的目标提纲。通过上述方式,本申请能够提高生成的提纲与用户需求的契合度。
-
公开(公告)号:CN110008327B
公开(公告)日:2022-01-14
申请号:CN201910257194.6
申请日:2019-04-01
Applicant: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 中科讯飞互联(北京)信息科技有限公司
IPC: G06F16/332 , G06F16/33 , G06F40/295 , G06Q50/18
Abstract: 本发明实施例提供一种法律回答生成方法及装置,属于自然语言处理技术领域。包括:获取问题数据,问题数据与法律咨询相关;将问题数据输入至强化学习模型中,输出回答数据。由于强化学习模型是基于初始模型训练得到的,而初始模型的类型为编解码模型,而不是基于历史信息检索,从而不需要依赖于历史的法律问答数据,可以针对法律提问创造出新的回答数据。因此,能够提供覆盖范围较广的回答。其次,由于初始模型的类型为编解码模型,从而不需要以三元组的形式表示训练数据,进而经初始模型训练得到的强化学习模型更适用于法律提问的回答。
-
公开(公告)号:CN111310447B
公开(公告)日:2024-02-02
申请号:CN202010192025.1
申请日:2020-03-18
Applicant: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC: G06F40/253 , G06F40/232
Abstract: 本发明实施例提供一种语法纠错方法、装置、电子设备和存储介质,其中方法包括:确定待纠错的文本;将文本输入至语法纠错模型,得到语法纠错模型输出的文本中每个字的检错结果和纠正结果;其中,语法纠错模型是基于样本文本、样本文本中每个样本字的样本检错结果和样本纠正结果训练得到的;语法纠错模型用于确定文本中每个字的检错结果,并基于每个字的检错结果所对应的解码方式,确定每个字的纠正结果。本发明实施例提供的方法、装置、电子设备和存储介质,无需人工校对即可实现语法纠错,在保证语法纠错效率的同时,提高了语法纠错的准确性和可靠性。
-
公开(公告)号:CN116741178A
公开(公告)日:2023-09-12
申请号:CN202310492855.X
申请日:2023-04-28
Applicant: 科大讯飞股份有限公司
IPC: G10L15/26 , G10L15/18 , G10L15/16 , G10L15/06 , G06F40/30 , G06F16/332 , G06F40/186
Abstract: 本申请公开了一种文稿生成方法、装置、设备和存储介质,其中,文稿生成方法包括:基于用户关于期望输出文稿的语音数据,得到对应的识别文本;基于识别文本进行分析,得到期望输出文稿的关键要素;其中,关键要素包括至少一个语义级别的子要素;基于关键要素,生成第一目标文稿。上述方案,能够缩短用户获取文稿的时间,提高用户工作效率。
-
公开(公告)号:CN116595138A
公开(公告)日:2023-08-15
申请号:CN202310506309.7
申请日:2023-05-05
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F3/0483 , G10L15/26
Abstract: 本申请实施例公开了一种知识问答方法、装置、设备及存储介质,获得文本以及针对文本的第一用户提问;第一用户提问指示获得与文本关联的知识;基于文本和第一用户提问生成第一用户提问对应的与文本关联的第一知识;输出第一知识。本申请提供的知识问答方法,只要获得文本和针对文本的用户提问就能自动获得用户提问对应的与文本关联的知识,从而帮助阅读者快速获得文本的相关知识。
-
公开(公告)号:CN116561297A
公开(公告)日:2023-08-08
申请号:CN202310506157.0
申请日:2023-05-05
Applicant: 科大讯飞股份有限公司
IPC: G06F16/34 , G06F3/0484 , G06F3/0482 , G10L15/26 , G06F40/30
Abstract: 本发明提供一种写作方法、装置、电子设备和存储介质,其中方法包括:接收用户输入;响应于用户输入,确定素材文档中的关键内容;基于所述素材文档和所述关键内容进行写作,得到目标文档,克服了传统方案中自动写作时模型输出的文稿重点不明确,且与用户实际关注的重点不相吻合,从而导致用户体验不佳的缺陷,明确了写作过程的侧重点,保证了模型输出文稿与用户关注点的契合,实现了低复杂度且优质的一键式写作,降低了写作所需的计算资源,提高了文稿的生成效率和生成质量,优化了用户体验。
-
-
-
-
-
-
-
-
-