-
公开(公告)号:CN103415850A
公开(公告)日:2013-11-27
申请号:CN201280002969.1
申请日:2012-07-20
Applicant: 株式会社东芝 , 东芝解决方案株式会社
IPC: G06F17/30
CPC classification number: G06F17/30477 , G06F17/30938
Abstract: 实施方式的结构化文档管理装置包括文档存储部、标题提取部、关联度计算部、文档检索部、标题选择部和标题表示部。文档存储部存储多个结构化文档。标题提取部提取结构化文档的标题,并制作含有所提取的标题的标题列表。关联度计算部分别计算结构化文档中的词汇与对应于结构化文档的标题之间的概念上的关联度。文档检索部检索含有与检索用关键字一致的词汇的结构化文档。标题选择部将相对于与检索用关键字一致的词汇的关联度较大的标题比关联度较小的标题更加优先地加以选择。显示控制部使由标题选择部选出的标题作为显示标题,显示在显示部上。
-
公开(公告)号:CN103430172A
公开(公告)日:2013-12-04
申请号:CN201280002861.2
申请日:2012-06-25
Applicant: 株式会社东芝 , 东芝解决方案株式会社
IPC: G06F17/30
CPC classification number: G06F17/30861
Abstract: 第一存储部(14)存储根据预先确定的规则将成为检索关键词的候选的关键词候选成组化而生成的关键词组。第一取得部(17)取得与确定前的输入字符串部分一致的关键词候选即第一推荐关键词。第二取得部(18)取得第一推荐关键词所隶属的关键词组中包含的、除了第一推荐关键词以外的其他关键词候选即第二推荐关键词。输出部(19)输出将第一推荐关键词及第二推荐关键词以可选择的方式进行显示的检索画面。检索部(20)进行以从检索画面选择的第一推荐关键词或者第二推荐关键词为检索关键词的检索。
-
公开(公告)号:CN103119596A
公开(公告)日:2013-05-22
申请号:CN201280002991.6
申请日:2012-06-25
Applicant: 株式会社东芝 , 东芝解决方案株式会社
CPC classification number: G06F17/30705 , G06F3/048 , G06F17/30707
Abstract: 特征语提取单元(201)从文件集合包含的文件提取特征语。特征语分组单元(202)将提取出的上述特征语分组为多个分组,该多个分组构成具有树结构的同义词词典的局部树,出现属于一个分组的上述特征语的上述文件的数量、与出现属于其他分组的上述特征语的上述文件的数量之差,在预先规定的基准值以下。文件分类单元(203),将上述文件集合包含的上述文件分类为在该文件中出现的上述特征语所属的分组。分类标签赋予单元(204)对上述多个分组中的各个分组赋予分类标签,该分类标签是代表属于各分组的上述特征语的语句。提示单元(302)将上述文件的分类结果,与对被分类后的分组赋予的上述分类标签对应起来进行提示。
-
公开(公告)号:CN103430172B
公开(公告)日:2018-04-20
申请号:CN201280002861.2
申请日:2012-06-25
Applicant: 株式会社东芝 , 东芝解决方案株式会社
IPC: G06F17/30
CPC classification number: G06F17/30861
Abstract: 第一存储部(14)存储根据预先确定的规则将成为检索关键词的候选的关键词候选成组化而生成的关键词组。第一取得部(17)取得与确定前的输入字符串部分一致的关键词候选即第一推荐关键词。第二取得部(18)取得第一推荐关键词所隶属的关键词组中包含的、除了第一推荐关键词以外的其他关键词候选即第二推荐关键词。输出部(19)输出将第一推荐关键词及第二推荐关键词以可选择的方式进行显示的检索画面。检索部(20)进行以从检索画面选择的第一推荐关键词或者第二推荐关键词为检索关键词的检索。
-
公开(公告)号:CN103119596B
公开(公告)日:2017-11-03
申请号:CN201280002991.6
申请日:2012-06-25
Applicant: 株式会社东芝 , 东芝解决方案株式会社
CPC classification number: G06F17/30705 , G06F3/048 , G06F17/30707
Abstract: 特征语提取单元(201)从文件集合包含的文件提取特征语。特征语分组单元(202)将提取出的上述特征语分组为多个分组,该多个分组构成具有树结构的同义词词典的局部树,出现属于一个分组的上述特征语的上述文件的数量、与出现属于其他分组的上述特征语的上述文件的数量之差,在预先规定的基准值以下。文件分类单元(203),将上述文件集合包含的上述文件分类为在该文件中出现的上述特征语所属的分组。分类标签赋予单元(204)对上述多个分组中的各个分组赋予分类标签,该分类标签是代表属于各分组的上述特征语的语句。提示单元(302)将上述文件的分类结果,与对被分类后的分组赋予的上述分类标签对应起来进行提示。
-
公开(公告)号:CN102591897A
公开(公告)日:2012-07-18
申请号:CN201110322714.0
申请日:2011-10-21
Applicant: 株式会社东芝 , 东芝解决方案株式会社
IPC: G06F17/30
CPC classification number: G06F17/3061
Abstract: 一种文件检索装置及文件检索方法,实施方式中的文件检索装置,具备:存储装置,该存储装置存储:结构化文件数据;抽出语句信息,包含在结构化文件数据中包含的每个语句的、抽出源的结构化文件数据的标识符与抽出源的结构化文件数据中的属性;以及方式判断规则,包含每个属性的检索方式和显示形式。此外,实施方式的文件检索装置,输入检索语句,在抽出语句信息中存在与检索语句一致的语句的情况下,参照抽出语句信息,判断检索语句的属性,根据判断出的属性,参照方式判断规则,判断对结构化文件数据进行检索的检索方式和检索结果的显示形式,通过判断出的检索方式,根据检索语句,进行文件检索,通过判断出的显示形式,输出检索结果。
-
公开(公告)号:CN1773507A
公开(公告)日:2006-05-17
申请号:CN200510120458.1
申请日:2005-11-10
Applicant: 株式会社东芝
CPC classification number: G06F17/30784 , G06F17/30743 , G06F17/30749 , H04N5/765 , H04N9/8205
Abstract: 一种特征向量生成装置,包括:输入单元,用于输入包括视频数据和音频数据中的至少一个的内容数据;生成单元,用于基于指示内容数据的特征状态出现的时刻的信息来生成特征向量,特征状态以视频数据和音频数据中的至少一个发生改变为表征;以及存储单元,用于存储内容数据和特征向量。
-
公开(公告)号:CN1815471A
公开(公告)日:2006-08-09
申请号:CN200510108482.3
申请日:2005-09-30
Applicant: 株式会社东芝
IPC: G06F17/30
CPC classification number: G06F17/3066 , G06F17/30654 , G10L15/26
Abstract: 本发明公开了一种信息检索系统,包括:语音识别装置,用于对口头询问进行语音识别以产生第一文本信息;产生装置,用于修正所述第一文本信息以产生作为询问的第二文本信息,以检索对于所述询问的回答;以及检索装置,用于通过使用所述第二文本信息,从文档数据库中检索所述回答。
-
-
-
-
-
-
-