DocValues从Lucene4.2和Solr4.2开始加入,通过建立字段的正排索引,提升sorting, faceting, grouping, function queries等性能。
介绍
在Solr的配置文件(schema.xml)中,如果需要为一个Filed建立倒排索引,可以通过配置(indexed=”true”)来实现,DocValues是一种正排索引方式,通过设置(DocValues=”true”)来实现。
1、docvalues的特性
近实时索引:在每一个索引段里面都会有一个docvalues数据结构,这个结构与索引同时建立,并且能够快速更新、生效;
基本的查询和过滤支持:你可以做基本的词、范围等基本查询,但是不参与评分,并且速度较慢,如果你对速度和评分排序有要求,你可以讲该字段设置为(indexed=”true”)
更好的压缩比: Docvalues fields 的压缩效果比 fieldcache好,但不强调做到极致。
节约内存:你可以定义一个fieldType的 docValuesFormat (docValuesFormat="Disk"),这样的只有一小部分数据加载到内存,其它部分保留在磁盘上。
2、docvalues不能实现的
不能用来代替存储字段:这和字段存储完全不同,只是一些便于(sort/facet/group/join/scoring)检索的数据存储结构。
对于静态索引不是最有选择:如果你有一个完全不更新的索引,docvalues看起来不会很吸引你。另一方面如果你需要和fieldcache对比,继续往下看。
风险较大:这个功能在4.2版本整合到Solr,非常新,可能仍有一些未知的bug!
Lucene的 DocValues 格式
Lucene有四个基础字段类型可以使用docvalues。目前Solr使用了其中三种:
Read full article from Solr中国 » Blog Archive » Solr4.2 新特性 DocValues - 【Solr教程|Solr安装|Solr配置|Solr优化|Solr资料】
No comments:
Post a Comment