elasticsearch源数据容量与索引容量的大小比例与很多因素有关,没有一个比较固定的比例。

首先,是否存_all有着最大的影响,如果你的es不是拿来做全文检索,那么这个_all可以不用存;

其次是_source(是否存原始数据);

最后是对多少个字段分词,多少个字段建索引,使用什么分词器等(用ikmax明显会比iksmart大很多)。

一般如果不存_all,只对需要的字段分词和建索引的话,索引数据不会比原始数据膨胀太多,加上副本或许就跟原始数据一样大,因为索引数据会压缩。


这里分享一套elasticsearch经典入门视频:

链接:http://pan.baidu.com/s/1qYrgyPe 密码:s9sr