文章详情|ELKstack中文指南之elasticsearch接口使用

ELKstack中文指南之elasticsearch接口使用 所属分类 elasticsearch 浏览量 1944
根据原文整理
https://elkguide.elasticsearch.cn/elasticsearch/api/CRUD.html


增删改查crud
搜索请求
painless脚本
reindex接口



文档型 NoSQL 数据库

基于 json的 RESTful 接口

写入数据 
curl -XPOST http://127.0.0.1:9200/logstash-2015.06.21/testlog -d '{
    "date" : "1434966686000",
    "user" : "chenlin7",
    "mesg" : "first message into Elasticsearch"
}'

不提供_id ，会自动生成并返回
{"_index":"logstash-2015.06.21","_type":"testlog","_id":"AU4ew3h2nBE6n0qcyVJK","_version":1,"created":true}

根据 _id 读取数据
curl -XGET http://127.0.0.1:9200/logstash-2015.06.21/testlog/AU4ew3h2nBE6n0qcyVJK

{"_index":"logstash-2015.06.21","_type":"testlog","_id":"AU4ew3h2nBE6n0qcyVJK","_version":1,"found":true,"_source":{
    "date" : "1434966686000",
    "user" : "chenlin7",
    "mesg" : "first message into Elasticsearch"
}}


只获取 _source
curl -XGET http://127.0.0.1:9200/logstash-2015.06.21/testlog/AU4ew3h2nBE6n0qcyVJK/_source

http://127.0.0.1:9200/bank/account/1
{
    "_index": "bank",
    "_type": "account",
    "_id": "1",
    "_version": 1,
    "found": true,
    "_source": {
        "account_number": 1,
        "balance": 39225,
        "firstname": "Amber",
        "lastname": "Duke",
        "age": 32,
        "gender": "M",
        "address": "880 Holmes Lane",
        "employer": "Pyrami",
        "email": "amberduke@pyrami.com",
        "city": "Brogan",
        "state": "IL"
    }
}
http://127.0.0.1:9200/bank/account/1/_source

{
    "account_number": 1,
    "balance": 39225,
    "firstname": "Amber",
    "lastname": "Duke",
    "age": 32,
    "gender": "M",
    "address": "880 Holmes Lane",
    "employer": "Pyrami",
    "email": "amberduke@pyrami.com",
    "city": "Brogan",
    "state": "IL"
}

只获取部分字段
http://127.0.0.1:9200/bank/account/1?_source=firstname,age

{
    "_index": "bank",
    "_type": "account",
    "_id": "1",
    "_version": 1,
    "found": true,
    "_source": {
        "firstname": "Amber",
        "age": 32
    }
}

删除数据
curl -XDELETE http://127.0.0.1:9200/logstash-2015.06.21/testlog/AU4ew3h2nBE6n0qcyVJK

数据更新
全量更新 局部更新

全量更新 
curl -XPOST http://127.0.0.1:9200/logstash-2015.06.21/testlog/AU4ew3h2nBE6n0qcyVJK -d '{
    "date" : "1434966686000",
    "user" : "chenlin7",
    "mesg" " "first message into Elasticsearch but version 2"
}'

curl -X POST http://127.0.0.1:9200/bank/account/1 -d '{"doc":{"newfield1":"value"}}'


{
    "_index": "bank",
    "_type": "account",
    "_id": "1",
    "_version": 2,
    "found": true,
    "_source": {
        "doc": {
            "newfield1": "value"
        }
    }
}


局部更新1

curl -XPOST 'http://127.0.0.1:9200/logstash-2015.06.21/testlog/AU4ew3h2nBE6n0qcyVJK/_update' -d '{
    "doc" : {
        "user" : "someone"
    }
}'

curl -X POST http://127.0.0.1:9200/bank/account/2/_update -d '{"doc":{"newfield1":"value"}}'

{
    "_index": "bank",
    "_type": "account",
    "_id": "2",
    "_version": 2,
    "found": true,
    "_source": {
        "account_number": 2,
        "balance": 28838,
        "firstname": "Roberta",
        "lastname": "Bender",
        "age": 22,
        "gender": "F",
        "address": "560 Kingsway Place",
        "employer": "Chillium",
        "email": "robertabender@chillium.com",
        "city": "Bennett",
        "state": "LA",
        "newfield1": "value"
    }
}


更新已有字段
curl -X POST http://127.0.0.1:9200/bank/account/2/_update -d '{"doc":{"age":"99"}}'


局部更新2

curl -XPOST 'http://127.0.0.1:9200/logstash-2015.06.21/testlog/AU4ew3h2nBE6n0qcyVJK/_update' -d '{
    "script" : "ctx._source.user = \"someone\""
}'


搜索请求


在 5.0 之前版本中，数据获取和数据搜索甚至有极大的区别：
刚写入的数据，可以通过 translog 立刻获取；但是却要等到 refresh 成为一个 segment 后，才能被搜索到。

从 5.0 版本开始，ES 不再维护 doc-id 到 translog offset 的映射关系，
一旦 GET 请求到这个还不能搜到的数据，就强制 refresh 出来 segment，这样就可以搜索了。
这个改动降低了数据获取的性能，但是节省了不少内存，减少了 young GC 次数，对写入性能的提升是很有好处的。



http://127.0.0.1:9200/bank/account/_search

全文检索
http://127.0.0.1:9200/bank/account/_search?q=Roberta

http://127.0.0.1:9200/bank/account/_search?q=firstname:Roberta

http://127.0.0.1:9200/bank/account/_search?q=firstname:"Roberta"

querystring 语法

全文检索：直接写要搜索的单词，例如 q=first
单字段的全文检索 q=mesg:first
单字段的精确检索 搜索单词加双引号 q=user:"tiger"
多个检索条件的组合 
   可以使用 NOT, AND 和 OR 来组合检索，注意必须是大写。 
   q=user:("chenlin7" OR "chenlin") AND NOT mesg:first

字段是否存在
   _exists_:user 表示要求 user 字段存在
   _missing_:user 表示要求 user 字段不存在
   
   
通配符  ? 表示单字母，* 表示任意个字母。 fir?t mess*

正则  注意 ES 中正则性能很差，而且支持的功能也不是特别强大，尽量不要使用
ES 支持的正则语法 https://www.elastic.co/guide/en/elasticsearch/reference/current/query-dsl-regexp-query.html#regexp-syntax

近似搜索 用 ~ 表示搜索单词可能有一两个字母写的不对，按照相似度返回结果。比如 frist~

范围搜索 对数值和时间使用范围搜索， 
  比如 rtt:>300，date:["now-6h" TO "now"} 
  [] 包含  {} 不包含
  
  
完整语法

https://www.elastic.co/guide/en/elasticsearch/reference/current/query-dsl-queries.html


term query 的写法，q=user:"tiger"
 
curl -XGET http://127.0.0.1:9200/_search -d '
{
  "query": {
    "term": {
      "user": "tiger" 
    }
  }
}'


聚合

在检索范围确定之后，支持对结果集做聚合查询，返回更直接的聚合统计结果。
1.0 版本之前，这个接口叫 Facet，1.0 版本之后，这个接口改为 Aggregation。
Aggregation 是 Facet 接口的强化升级版本



1.x 系列中，aggregation 分为 bucket 和 metric 两种，分别用作词元划分和数值计算。
bucket aggregation，支持在自身结果集的基础上，叠加新的 aggregation

2.x 中，新增了 pipeline aggregation 类型
可以在已有 aggregation 返回的数组数据之后，再对这组数值做一次运算。最常见的，就是对时序数据求移动平均值。

aggregation 堆叠层级关系
 
支持的聚合请求列表
https://www.elastic.co/guide/en/elasticsearch/reference/current/search-aggregations.html

search 请求参数
from 默认0
size 默认30

给 coordinate node 返回 shards number * (from + size) 条数据，然后在单机上进行排序，最后给客户端返回这个 size 大小的数据的。
谨慎使用 from 和 size 参数

2.x 新增了一个索引级别的动态控制配置项：index.max_result_window，默认为 10000。
即 from + size 大于 10000 的话，直接拒绝请求，以保护节点。

2.x 还提供了一个小优化：当设置 size=0 时，自动改变 search_type 为 count。跳过搜索过程的 fetch 阶段。

timeout
coordinate node 等待超时时间。到达该阈值后，coordinate node 直接把当前收到的数据返回给客户端，不再继续等待 data node 后续的返回了。

terminate_after
各 data node 上，扫描单个分片时，找到多少条记录后，就认为足够了。
request_cache


script

使用自定义脚本扩展功能，包括评分、过滤函数和聚合字段等
内置脚本引擎 MVEL、Groovy、Lucene expression 
5.0版本实现了专用的脚本引擎 Painless

ES 进程默认每分钟扫描一次 /etc/elasticsearch/scripts/ 目录，并尝试加载该目录下所有文件作为 script。

支持通过插件方式，扩展脚本语言的支持，目前默认自带的语言包括：
painless
lucene expression
groovy
mustache



reindex

curl -XPOST http://localhost:9200/_reindex -d '
{
  "source": {
    "index": "logstash-2016.10.29"
  },
  "dest": {
    "index": "logstash-new-2016.10.29"
  }
}'
kafka副本机制

网络杠精定律

ELKstack中文指南之elasticsearch架构原理

时区知识点整理

YAML简单介绍

kibana简单介绍