Lucene学习笔记之Inverted Index (Inverted index in Lucene)
Lucene并不是称为倒排表为Inverted List,它是用Posting List来称呼,所以我们找文件的话,要找跟Posting List相关的。你会发现最相关的类是Lucene41PostingsWriter,这个文件还蛮庞大的,有几个要点我们可以注意一下
Lucene并不是称为倒排表为Inverted List,它是用Posting List来称呼,所以我们找文件的话,要找跟Posting List相关的。你会发现最相关的类是Lucene41PostingsWriter,这个文件还蛮庞大的,有几个要点我们可以注意一下
- 没有用Vector或者ArrayList等动态的数据结构,而是用数组,目的是提高效率,数组的最大长度是
Inverted list里面的元素是怎么排序的?
Inverted Index在Segment里头是怎么存储的?
- 随着不断添加document进来,很多inverted list也会跟着变长,这对存储是件挺麻烦的事情,它不像数据库,每一个attribute设个最长的长度,超过就报错,但Lucene显然不能这么做,这方面的I/O性能Lucene是怎么保证的?
No comments:
Post a Comment