-
公开(公告)号:CN109923538B
公开(公告)日:2023-09-15
申请号:CN201780069191.9
申请日:2017-09-14
Applicant: 株式会社野村综合研究所
Inventor: 毛羽翔
Abstract: 文本检索装置12对由原始文本中记载的互不相同的多个词语变换出的互不相同的固定长度的代码的多个文本数据进行存储。用户终端14指定多个词语,且向文本检索装置12发送以词语数指定这些多个词语所应存在的范围的检索要求。文本检索装置12获取与检索要求所指定的多个词语各自对应的固定长度的代码,与检索要求所指定的词语数基准的范围、固定的代码长度相应地导出字符数基准的范围。文本检索装置12执行以多个词语的代码和字符数基准的范围为条件的邻近检索,从多个文本数据中提取符合上述条件的文本数据。
-
公开(公告)号:CN110235127A
公开(公告)日:2019-09-13
申请号:CN201780084260.3
申请日:2017-08-07
Applicant: 株式会社野村综合研究所
Inventor: 毛羽翔
IPC: G06F17/27
Abstract: 词典制作装置(14)对通过自然语言处理装置(16)进行自然语言处理过程中所使用的词典进行记忆,该词典是存储有作为意义可单独成立的单词的主题词的词典。词典制作装置(14)从专利文献DB(12)中保存的专利文献字符串中,以至少除去已经存储在词典中的主题词之外的剩余的字符串作为短语,从中提取多个短语。在提取的多个短语中,指定个数以上的短语的开头部分存在相同的字符串时,词典制作装置(14)将该相同的字符串作为主题词进行提取。词典制作装置(14)将提取的主题词存储至词典。
-
公开(公告)号:CN109923538A
公开(公告)日:2019-06-21
申请号:CN201780069191.9
申请日:2017-09-14
Applicant: 株式会社野村综合研究所
Inventor: 毛羽翔
Abstract: 文本检索装置12对由原始文本中记载的互不相同的多个词语变换出的互不相同的固定长度的代码的多个文本数据进行存储。用户终端14指定多个词语,且向文本检索装置12发送以词语数指定这些多个词语所应存在的范围的检索要求。文本检索装置12获取与检索要求所指定的多个词语各自对应的固定长度的代码,与检索要求所指定的词语数基准的范围、固定的代码长度相应地导出字符数基准的范围。文本检索装置12执行以多个词语的代码和字符数基准的范围为条件的邻近检索,从多个文本数据中提取符合上述条件的文本数据。
-
公开(公告)号:CN110235127B
公开(公告)日:2023-05-26
申请号:CN201780084260.3
申请日:2017-08-07
Applicant: 株式会社野村综合研究所
Inventor: 毛羽翔
IPC: G06F40/20
Abstract: 词典制作装置(14)对通过自然语言处理装置(16)进行自然语言处理过程中所使用的词典进行记忆,该词典是存储有作为意义可单独成立的单词的主题词的词典。词典制作装置(14)从专利文献DB(12)中保存的专利文献字符串中,以至少除去已经存储在词典中的主题词之外的剩余的字符串作为短语,从中提取多个短语。在提取的多个短语中,指定个数以上的短语的开头部分存在相同的字符串时,词典制作装置(14)将该相同的字符串作为主题词进行提取。词典制作装置(14)将提取的主题词存储至词典。
-
-
-