-
公开(公告)号:CN118297062A
公开(公告)日:2024-07-05
申请号:CN202311040253.7
申请日:2023-08-17
Applicant: 株式会社东芝
IPC: G06F40/289 , G06F40/216
Abstract: 本发明提供一种信息处理装置、信息处理方法以及存储介质。实施方式的信息处理装置具备文本受理部、存储部、计算部、合并部、决定部以及分割部。文本受理部受理输入文本数据。存储部存储计算不同的多个粒度的分割评分的统计模型。计算部将输入文本数据输入到统计模型来计算不同的多个粒度的分割评分。合并部将不同的多个粒度的分割评分合并为1个合并评分。决定部根据输入文本数据和合并评分,决定输入文本数据中的分割位置。分割部在分割位置分割输入文本数据而生成构造化文本数据。
-
公开(公告)号:CN111159364B
公开(公告)日:2023-10-03
申请号:CN201910811007.4
申请日:2019-08-30
Applicant: 株式会社东芝
IPC: G06F16/332
Abstract: 本发明涉及对话系统、对话装置、对话方法及存储介质。提供当在用户的提问中包含未知的关键词时也能输出与用户的交互继续的响应的对话系统、对话装置、对话方法及存储介质。一个实施方式的对话系统具备知识参照部、未知关键词检测部、关联关键词推测部及响应生成部。知识参照部通过利用输入句的解析结果参照提问响应知识,得到针对输入句的回答的候补。未知关键词检测部从输入句检测未知关键词。关联关键词推测部响应于检测到未知关键词,从预定的关键词获取具有与未知关键词接近的意思的关联关键词的候补。响应生成部在未检测到未知关键词时根据回答的候补生成针对输入句的响应,在检测到未知关键词时根据关联关键词的候补生成针对输入句的响应。
-
公开(公告)号:CN114444480A
公开(公告)日:2022-05-06
申请号:CN202111008046.4
申请日:2021-08-31
Applicant: 株式会社东芝
IPC: G06F40/242 , G06F40/284 , G06F40/166 , G06F40/117
Abstract: 本发明的实施方式涉及词典编辑装置、词典编辑方法以及程序。提供能够削减单词抽取结果以及读音赋予结果的确认成本的技术。一个实施方式的词典编辑装置具备单词抽取部、读音赋予部以及修正候补确定部。单词抽取部从文本数据抽取单词。读音赋予部对所述单词赋予读音。修正候补确定部在对包含抽取出的所述单词和所赋予的所述读音的单词信息进行了修正的情况下,确定修正候补,该修正候补为应与所述修正关联地修正的单词或者读音。
-
公开(公告)号:CN114168718A
公开(公告)日:2022-03-11
申请号:CN202110219897.7
申请日:2021-02-26
Applicant: 株式会社东芝
IPC: G06F16/332 , G06F16/33
Abstract: 本发明的实施方式涉及信息处理装置、方法以及信息记录介质。提供能够辅助适于对话系统的数据的编辑的信息处理装置、方法以及信息记录介质。实施方式的信息处理装置包括:生成部,基于使用FAQ集所包含的多个关键字的每一个关键字检索所述FAQ集而得到的结果,对所述多个关键字的每一个关键字进行1次以上的对话,而针对所述多个关键字的每一个关键字生成对话数据;以及汇总部,基于所述对话数据,生成汇总数据,该汇总数据是对所述多个关键字的每一个关键字在对话中被使用的频度进行汇总而得到的。
-
公开(公告)号:CN113342925A
公开(公告)日:2021-09-03
申请号:CN202010895530.2
申请日:2020-08-31
Applicant: 株式会社东芝
IPC: G06F16/33 , G06F16/332
Abstract: 实施方式涉及接口提供装置、接口提供方法以及程序。提供如下接口提供装置、接口提供方法以及程序:能够提供受理用于使来自系统的反问语句更适当的反馈输入的接口。实施方式的接口提供装置具有确定部和生成部。确定部从包含提问文本和响应文本的对话数据确定关键词。生成部生成用于显示接口的显示信息,该接口受理与关键词的有用度有关的输入。
-
公开(公告)号:CN111506712A
公开(公告)日:2020-08-07
申请号:CN201910849865.8
申请日:2019-09-10
Applicant: 株式会社东芝
IPC: G06F16/332
Abstract: 本发明提供能够更容易地构建的对话系统、对话方法、程序以及存储介质。实施方式的对话系统包括处理部。处理部当被输入包含一个以上的单词的第1文章时,将该单词中的至少一部分设定为第1查询关键词。处理部从包含多个包含提问以及回答的提问回答对的提问回答集选定包含第1查询关键词的一个以上的提问回答对。处理部在所选定的提问回答对的数量为1时,输出表示该提问回答对所包含的回答的第1响应,在数量为第1阈值以上时,输出包括从所选定的提问回答对抽取出的第1提问关键词以及第2提问关键词的第2响应。
-
公开(公告)号:CN119132272A
公开(公告)日:2024-12-13
申请号:CN202410224920.5
申请日:2024-02-29
Applicant: 株式会社东芝
Abstract: 实施方式提供存储介质、信息处理装置以及信息处理方法。即使在声音辨识的专家不在的情况下,也能够决定适当的输入形式。实施方式所涉及的存储介质存储有信息处理程序。所述信息处理程序使计算机实现信息取得部和形式推测部。所述信息取得部针对每个项目,从包括声音输入的输入栏的记录用数据单取得1个以上的项目、和与针对所述1个以上的项目的输入栏的值有关的信息。所述形式推测部根据所述信息,推测所述输入栏的输入形式。
-
公开(公告)号:CN118819452A
公开(公告)日:2024-10-22
申请号:CN202410217305.1
申请日:2024-02-28
Applicant: 株式会社东芝
Abstract: 本申请涉及声音输入辅助装置以及存储介质。声音输入辅助装置具备录音部、声音识别部、记录生成部以及比较部。录音部对使用声音输入装置的使用者的话语进行录音。声音识别部与用于使用声音输入装置输入第1记录内容的声音识别不同地对所录音的话语进行声音识别。记录生成部基于不同地进行声音识别而获得的识别结果和用于使用声音输入装置的输入的对使用者的下个动作,生成第2记录内容。比较部对第1记录内容与第2记录内容进行比较。
-
公开(公告)号:CN113299266B
公开(公告)日:2024-09-20
申请号:CN202010896712.1
申请日:2020-08-31
Applicant: 株式会社东芝
IPC: G10L13/02 , G10L13/08 , G06F40/263 , G10L15/26
Abstract: 本发明提供一种数据生成装置、数据生成方法以及记录介质,能够生成精度高的模拟数据。实施方式所涉及的数据生成装置具有语音合成部、语音辨识部、匹配处理部以及生成部。语音合成部根据原始文本生成语音数据。语音辨识部根据语音数据生成辨识文本。匹配处理部进行原始文本与辨识文本的匹配。生成部将匹配度满足条件的语音数据和原始文本对应起来生成数据集。
-
公开(公告)号:CN118057358A
公开(公告)日:2024-05-21
申请号:CN202311117404.4
申请日:2023-08-31
Applicant: 株式会社东芝
IPC: G06F16/332 , G06F16/33 , G06F40/284
Abstract: 本发明的实施方式涉及文档检索装置、文档检索方法以及文档检索程序。提供能够容易地检索所期望的信息的文档检索装置、文档检索方法以及文档检索程序。一实施方式的文档检索装置具备第1存储部、检索部以及显示信息生成部。第1存储部存储表示多个块和与所述多个块建立关联的多个参照特征的块信息,所述多个块是文档中包含的在意思上相关联的句子的集合。检索部从输入的查询中提取检索所使用的检索特征,基于所述检索特征与所述多个参照特征的匹配,从所述多个块中检索与所述查询关联的第1块。显示信息生成部生成用于强调显示所述第1块的显示信息。
-
-
-
-
-
-
-
-
-