-
公开(公告)号:CN101118560A
公开(公告)日:2008-02-06
申请号:CN200710140036.X
申请日:2007-08-03
Applicant: 株式会社东芝
IPC: G06F17/30
CPC classification number: G06F17/30731
Abstract: 一种关键词输出设备,包括文档接收单元,接收指定时间段内的文档;关键词分析单元,对文档分析可能的关键词;关键词提取单元,对各关键词计算分数并以分数顺序提取关键词;关键词结构产生单元,通过分类和分级各提取的关键词,产生关键词结构;关键词输出单元,基于关键词结构,以分数的降序输出关键词。
-
公开(公告)号:CN104464731A
公开(公告)日:2015-03-25
申请号:CN201410305619.3
申请日:2014-06-30
Applicant: 株式会社东芝
Abstract: 本发明提供一种数据收集装置及方法、语音对话装置及方法。本发明的实施方式涉及数据收集装置、语音对话装置、方法以及程序。提供能够高精度地推测读法的数据收集装置、语音对话装置、方法以及程序。本实施方式的数据收集装置与对话的规定的每个分类对应关联地收集在语音对话中使用的数据,包括语音识别部、对话判定部以及储存部。语音识别部对所发言的语音进行语音识别,生成语音的书写字符串和书写字符串的读法。对话判定部使用书写字符串以及读法中的至少某一方来判定语音对话是否成功。储存部在判定为语音对话成功了的情况下,将书写字符串以及读法与分类对应关联起来进行储存。
-
公开(公告)号:CN102549569A
公开(公告)日:2012-07-04
申请号:CN200980161698.2
申请日:2009-10-05
Applicant: 株式会社东芝
IPC: G06F17/30
CPC classification number: G06F17/30722
Abstract: 当共有流派特征词语被包括在用户感兴趣的感兴趣节目和包括相同短语的相似短语节目中时,降低短语相似度。当共有流派特征词语被包括在感兴趣节目以及包括与感兴趣节目相同的流派的相似流派节目中时,增加流派相似度。基于短语相似度来呈现相似短语节目,并且基于流派相似度来呈现相似流派节目。
-
公开(公告)号:CN101155280A
公开(公告)日:2008-04-02
申请号:CN200710161883.4
申请日:2007-09-27
Applicant: 株式会社东芝
IPC: H04N5/445
CPC classification number: G11B27/10 , G11B27/031 , G11B27/102 , Y10S707/915
Abstract: 一种节目构造装置,包括:播放列表收集单元,用于为定义了时间序列的内容收集播放列表;第一存储单元,用于与所述播放列表中出现的每个截止点的出现频率相对应地存储所述截止点,并且所述截止点是所述内容的节目结构的断点;计算单元,用于根据每个所述截止点的出现频率,计算由所述截止点定义的场景片断之间的相关性级别;提取单元,用于基于所述相关性级别,提取多级章节分割;以及第二存储单元,用于存储所述提取出的构造为树形的多级章节分割。
-
公开(公告)号:CN116266188A
公开(公告)日:2023-06-20
申请号:CN202211059341.7
申请日:2022-08-31
Applicant: 株式会社东芝
IPC: G06F16/33 , G06F16/338 , G06N20/00
Abstract: 本实施方式涉及信息提取装置、信息提取方法以及存储介质。一个实施方式的信息提取装置具备故障事件提取部、处置候补提取部和效果判别部。故障事件提取部从文本数据提取故障事件的记载。处置候补提取部从文本数据提取用于对故障事件进行处置的处置候补的记载。效果判别部判别针对故障事件的处置候补的效果。
-
公开(公告)号:CN102549569B
公开(公告)日:2014-11-12
申请号:CN200980161698.2
申请日:2009-10-05
Applicant: 株式会社东芝
IPC: G06F17/30
CPC classification number: G06F17/30722
Abstract: 当共有流派特征词语被包括在用户感兴趣的感兴趣节目和包括相同短语的相似短语节目中时,降低短语相似度。当共有流派特征词语被包括在感兴趣节目以及包括与感兴趣节目相同的流派的相似流派节目中时,增加流派相似度。基于短语相似度来呈现相似短语节目,并且基于流派相似度来呈现相似流派节目。
-
公开(公告)号:CN101547326A
公开(公告)日:2009-09-30
申请号:CN200810181705.2
申请日:2008-12-04
Applicant: 株式会社东芝
CPC classification number: H04N5/147 , H04N5/44508 , H04N21/44008 , H04N21/478 , H04N21/8405 , H04N21/8545
Abstract: 本发明提供一种通知内容场景出现的装置和方法,提取单元从自所播放的场景中提取的元数据中提取关键词,附加单元向关键词附加语义类别,语义类别判定单元判定语义类别是否是应播放类别,当存在附加了应播放类别的关键词时,取得单元取得至少一个不具有该应播放类别的关键词作为应监视关键词,当元数据包括应监视关键词和附加了应停止类别的关键词时,出现判定单元判定包括应监视关键词的场景在内容中出现。
-
-
-
-
-
-