一种高效倒排索引组织方法

    公开(公告)号:CN103853772B

    公开(公告)日:2017-02-08

    申请号:CN201210511478.1

    申请日:2012-12-04

    Inventor: 王弘蔚

    Abstract: 本发明公开了一种高效倒排索引组织方法。将记录倒排项和属性倒排项分开存储,减少信息冗余;采用分块方式对倒排索引进行存储,以数据库索引优化为切入点,综合利用链表和集中定位表的优势对倒排块进行管理,既有利于索引动态维护又便于SKIP技术下的随即访问;同时根据域间关联关系,采用了压缩技术,以达到尽量少的空间存储尽量多的信息量。所提供的倒排索引结构及组织方法,减少了存储空间、优化了访问时间,在一定程度解决了倒排索引优化问题,能够实现海量数据的有效管理。

    段句位的倒排索引结构设计及其限定运算全文检索的方法

    公开(公告)号:CN116578666A

    公开(公告)日:2023-08-11

    申请号:CN202310847909.X

    申请日:2023-07-12

    Abstract: 本发明提出了一种段句位的倒排索引结构设计及其限定运算全文检索的方法,具体的,设计了一种支持段句位的倒排索引结构包括:词典和与所述词典中的词对应的倒排索引列表;所述倒排索引列表包括:待索引文件ID为DocID、词频TF、位置POS、句子SEN、段落SEG。同时,本发明提出了一种段句位限定运算全文检索的方法,在倒排索引列表中存储索引词的位置(POS)、句子(SEN)、段落(SEG)等信息,通过对关键词的位置关系进行设定,在所述倒排索引列表中对位置属性校验,实现文档过滤,返回给用户满足段句位要求的文档。实现用户对段、句、字距离等高级查询需求,同时对查询语句进行相关度评分,使全文检索过程更加完善。

    段句位的倒排索引结构设计及其限定运算全文检索的方法

    公开(公告)号:CN116578666B

    公开(公告)日:2023-09-22

    申请号:CN202310847909.X

    申请日:2023-07-12

    Abstract: 本发明提出了一种段句位的倒排索引结构设计及其限定运算全文检索的方法,具体的,设计了一种支持段句位的倒排索引结构包括:词典和与所述词典中的词对应的倒排索引列表;所述倒排索引列表包括:待索引文件ID为DocID、词频TF、位置POS、句子SEN、段落SEG。同时,本发明提出了一种段句位限定运算全文检索的方法,在倒排索引列表中存储索引词的位置(POS)、句子(SEN)、段落(SEG)等信息,通过对关键词的位置关系进行设定,在所述倒排索引列表中对位置属性校验,实现文档过滤,返回给用户满足段句位要求的文档。实现用户对段、句、字距离等高级查询需求,同时对查询语句进行相关度评分,使全文检索过程更加完善。

    一种高效的倒排索引结构及组织方法

    公开(公告)号:CN103853772A

    公开(公告)日:2014-06-11

    申请号:CN201210511478.1

    申请日:2012-12-04

    Inventor: 王弘蔚

    Abstract: 本发明公开了一种高效的倒排索引结构及组织方法。将记录倒排项和属性倒排项分开存储,减少信息冗余;采用分块方式对倒排索引进行存储,以数据库索引优化为切入点,综合利用链表和集中定位表的优势对倒排块进行管理,既有利于索引动态维护又便于SKIP技术下的随即访问;同时根据域间关联关系,采用了压缩技术,以达到尽量少的空间存储尽量多的信息量。所提供的倒排索引结构及组织方法,减少了存储空间、优化了访问时间,在一定程度解决了倒排索引优化问题,能够实现海量数据的有效管理。

Patent Agency Ranking