文章详情|elasticsearch5.0基本概念

elasticsearch5.0基本概念 所属分类 elasticsearch 浏览量 1178

根据原文翻译整理
https://www.elastic.co/guide/en/elasticsearch/reference/5.0/_basic_concepts.html

Near Realtime (NRT) 准实时 
Elasticsearch是一个接近实时的搜索平台。
这意味着从索引文档到可搜索文档的时间会有轻微的延迟(通常是一秒)。

Cluster
集群 默认名字 elasticsearch
不同的环境使用不同的集群名字， 单个节点的集群是有效的

Node 节点 
节点名 默认情况在启动时分配一个UUID

index 
对应关系数据库中 db 

type 
对应关系数据中的表
在索引中，可以定义一个或多个类型。类型是索引的逻辑上的分类/分区，其语义完全由你决定。
通常，类型是具有一组公共字段的文档。


document 
对应关系数据库中的记录行
文档使用json表示
在索引/类型中，可以存储任意数量的文档。
注意，尽管文档物理上驻留在索引中，文档实际上必须被索引/分配给索引中的类型。



Shards 
 解决单个索引过大的问题
 水平扩容 
 多个分片并行操作，提升性能和吞吐量
 
 分片分布机制，搜索请求文档聚合机制 对用户透明 
 

Replicas 
每个索引可以分为多个分片，1个分片可以有0到多个副本。

主分片 original/primary shard
replica shards (the copies of the primary shards）

高可用
多个副本上并行操作，提升性能和吞吐量

索引创建之后，可以随时动态地更改副本的数量，但不能改变分片数。


如果集群中至少有两个节点，每个索引默认分配5个主分片和1个副本
索引将有5个主分片和5个副本分片(1个完整副本)
索引总共有10个分片

 "settings": {
        "number_of_shards" :   1,
        "number_of_replicas" : 0
        }

zookeeper状态信息stat字段说明

kafka消费者offset记录位置和方式

KPI与KOR

elasticsearch5.0术语

elasticsearch5.0入门之索引操作

elasticsearch中refresh和flush区别