-
公开(公告)号:CN116578666B
公开(公告)日:2023-09-22
申请号:CN202310847909.X
申请日:2023-07-12
Applicant: 拓尔思信息技术股份有限公司
IPC: G06F16/31 , G06F16/33 , G06F40/242 , G06F40/216 , G06F40/284 , G06F40/253
Abstract: 本发明提出了一种段句位的倒排索引结构设计及其限定运算全文检索的方法,具体的,设计了一种支持段句位的倒排索引结构包括:词典和与所述词典中的词对应的倒排索引列表;所述倒排索引列表包括:待索引文件ID为DocID、词频TF、位置POS、句子SEN、段落SEG。同时,本发明提出了一种段句位限定运算全文检索的方法,在倒排索引列表中存储索引词的位置(POS)、句子(SEN)、段落(SEG)等信息,通过对关键词的位置关系进行设定,在所述倒排索引列表中对位置属性校验,实现文档过滤,返回给用户满足段句位要求的文档。实现用户对段、句、字距离等高级查询需求,同时对查询语句进行相关度评分,使全文检索过程更加完善。
-
公开(公告)号:CN116578666A
公开(公告)日:2023-08-11
申请号:CN202310847909.X
申请日:2023-07-12
Applicant: 拓尔思信息技术股份有限公司
IPC: G06F16/31 , G06F16/33 , G06F40/242 , G06F40/216 , G06F40/284 , G06F40/253
Abstract: 本发明提出了一种段句位的倒排索引结构设计及其限定运算全文检索的方法,具体的,设计了一种支持段句位的倒排索引结构包括:词典和与所述词典中的词对应的倒排索引列表;所述倒排索引列表包括:待索引文件ID为DocID、词频TF、位置POS、句子SEN、段落SEG。同时,本发明提出了一种段句位限定运算全文检索的方法,在倒排索引列表中存储索引词的位置(POS)、句子(SEN)、段落(SEG)等信息,通过对关键词的位置关系进行设定,在所述倒排索引列表中对位置属性校验,实现文档过滤,返回给用户满足段句位要求的文档。实现用户对段、句、字距离等高级查询需求,同时对查询语句进行相关度评分,使全文检索过程更加完善。
-