文章详情|elasticsearch 优化点

elasticsearch 优化点 所属分类 elasticsearch 浏览量 1732
indices.memory.index_buffer_size
默认 jvm大小的10% ，可增大


segment merge
增加 Index Refresh 间隔 ， 减少 Segment Merge 次数
only_expunge_deletes设置为true ，合并过程会把删除的数据清理掉

SearchType
默认 QUERY_THEN_FETCH

QUERY_THEN_FETCH
先向所有的分片发请求，各分片只返回文档的相似度得分和文档的ID，然后协调节点按照各分片返回的分数进行重新排序和排名 
根据文档ID获取文档的详细信息 

QUERY_AND_FETCH
协调节点向所有分片发送查询请求，各分片将文档的相似度得分和文档的详细信息一起返回
协调节点进行重新排序，取出需要返回给客户端的数据
只需要在分片中查询一次，性能较好


DFS_QUERY_THEN_FETCH
与 QUERY_THEN_FETCH 类似，但它包含一个额外的阶段,在初始查询中执行全局的词频计算，以使得更精确地打分，从而让查询结果更相关。
QUERY_THEN_FETCH 使用的是分片内部的词频信息，而 DFS_QUERY_THEN_FETCH 使用公共的词频信息，相比 QUERY_THEN_FETCH 性能更低

DFS_QUERY_AND_FETCH 与 QUERY_AND_FETCH 类似，不过使用的是全局的词频

search_type=query_and_fetch

bool 查询的 filter 筛选
filter 不参与相关性评分，查询子句可以被系统缓存，性能高于普通的query查询
bool查询中支持4种子句，分别是filter must must_not should
filter和must_not属于过滤器，过滤器查询先于其它查询执行


预排序 IndexSorting
ES 6.x之后新增预排序功能，索引在创建之前可以指定数据写入后的排序方式，
当query时指定的排序方式和预排序逻辑一致时将能够很快获得排序结果，需要注意的是查询时不能开启total值


磁盘 尽量使用SSD盘  或者挂载多块盘提升io性能

设置独立的聚合节点
# 查询聚合节点配置 
node.master:false
node.data:false
node.ingest:false

查询中断
teminate_after 指定每个 shard 匹配 N 条记录后返回，设置查询超时时间 timeout  
{ 
    "timeout": "10s",
    "terminate_after": 1000,
    "query": {
        
    }
}

调整聚合方式
默认深度优先聚合
"collect_mode" : "breadth_first"

depth_first 直接进行子聚合的计算
breadth_first 先计算出当前聚合的结果，针对这个结果在对子聚合进行计算

索引冷热分离

# cat elasticsearch.yml    // 配置文件设置tag区分
node.attr.tag: cold/hot   

# bin/elasticsearch -d -Enode.attr.box_type=hot  //启动设置



其他配置说明

cluster.name  
集群名 自动发现同一网段下集群名相同的节点


node.nam："node1" 
节点名，同一个集群中不能重复。名称设置后，不能改 

noed.master：true
指定节点是否有资格被选举成为 Master  默认 True 

node.data：true 
指定节点是否存储索引数据，默认 True 

index.number_of_shards：5
索引分片个数，默认 5 。可以在创建索引时设置 ，如果数据量不大，设置成 1 效率最高。

index.number_of_replicas：1
索引副本个数，默认为1 个 

path.conf：/path/to/conf
配置文件存储路径，默认   conf  目录


path.data：/path/to/data1,/path/to/data2
设置索引数据存储路径，默认 data 目录 ，注意不要使用默认值，若 ES 升级，有可能丢失数据 

path.logs：/path/to/logs
设置日志文件的存储路径，默认 logs 

path.plugins：/path/to/plugins
设置第三方插件的路径，默认 plugins  

bootstrap.mlockall：true
锁定内存,保证不 Swap

network.bind_host：192.168.0.1
绑定的 IP 地址 ， 默认 0.0.0.0

network.publish_host：192.168.0.1

network.host：192.168.0.1
同时设置 bind_host 和 publish_host 这两个参数


http.port：9200
对外服务的 HTTP 端口，默认 9200
节点需要配置两个端口，对外提供服务端口，集群内部使用的端口

transport.tcp.port：9300
集群节点间通讯的 TCP 端口，默认 9300 

transport.tcp.compress：true
节点间传输数据时是否压缩，默认 false 

index.merge.scheduler.max_thread_count:1    
索引merge最大线程数

index.translog.durability:async             
异步写硬盘，提升写性能

index.translog.sync_interval:120s           
translog 间隔时间

thread_pool.bulk.size:20                    
写入线程个数  

thread_pool.bulk.queue_size:1000            
写入线程队列大小

index.refresh_interval:300s                 
index刷新间隔

discovery.zen.minimum_master_nodes：1
选举 Master 节点时需要参与的最少的候选主节点数，默认 1 
建议设置为(master_eligible_nodes/2)+1   ， master_eligible_nodes 表示集群中的候选主节点数


discovery.zen.ping.timeout：3s
自动发现其他节点时 Ping 连接的超时时间，默认 3 秒
kafka核心知识点

java中的list

arthas 异常排查技巧

Java异常知识点

mysql explain 简介

mysql中的浮点数