Lucene4.3开发之第九步之渡劫中期(九)
Lucene4.x之后的所有索引格式如下所示:
Please read full article from Lucene4.3开发之第九步之渡劫中期(九)
Lucene4.x之后的所有索引格式如下所示:
文件名 | 后缀 | 描述 |
Segments File | segments.gen, segments_N | 存储段文件的提交点信息 |
Lock File | write.lock | 文件锁,保证任何时刻只有一个线程可以写入索引 |
Segment Info | .si | 存储每个段文件的元数据信息 |
Compound File | .cfs, .cfe | 复合索引的文件,在系统上虚拟的一个文件,用于频繁的文件句柄 |
Fields | .fnm | 存储域文件的信息 |
Field Index | .fdx | 存储域数据的指针 |
Field Data | .fdt | 存储所有文档的字段信息 |
Term Dictionary | .tim | term字典,存储term信息 |
Term Index | .tip | term字典的索引文件 |
Frequencies | .frq | 词频文件,包含文档列表以及每一个term和其词频 |
Positions | .prx | 位置信息,存储每个term,在索引中的准确位置 |
Norms | .nrm.cfs, .nrm.cfe | 存储文档和域的编码长度以及加权因子 |
Per-Document Values | .dv.cfs, .dv.cfe | 编码除外的额外的打分因素, |
Term Vector Index | .tvx | term向量索引,存储term在文档中的偏移距离 |
Term Vector Documents | .tvd | 包含每个文档向量的信息 |
Term Vector Fields | .tvf | 存储filed级别的向量信息 |
Deleted Documents | .del | 存储索引删除文件的信息 |
No comments:
Post a Comment