English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية

Elasticsearch 집계 데이터

汇总作业是一项周期性任务,它汇总索引模式指定的索引中的数据,并将其汇总到新索引中。在下面的示例中,我们创建了一个名为sensor的索引,该索引具有不同的日期时间戳。然后我们创建一个rollup作业,使用cron job周期性地从这些索引中汇总数据。

PUT /sensor/_doc/1
{
    1516729294000,
   "temperature": 200,
   "voltage": 5.2,
   "node": "a"
}

在运行上面的代码时,我们得到以下结果-

{
   "_index" : "sensor",
   "_type" : "_doc",
   "_id" : "1",
   "_version" : 1,
   "result" : "created",
   "_shards" : {
      "total" : 2,
      "successful" : 1,
      
   },
   "_seq_no" : 0,
   "_primary_term" : 1
}

现在,为其他文档添加第二个文档,依此类推。

PUT /sensor-2018-01-01/_doc/2
{
    1413729294000,
   "temperature": 201,
   "voltage": 5.9,
   "node": "a"
}

创建汇总作业

PUT _rollup/job/sensor
{
   "index_pattern": "sensor"-*",
   "rollup_index": "sensor_rollup",
   "cron": "*/30 * * * * ?",
   1000,
   "groups" : {
      "date_histogram": {
         "field": "timestamp",
         "interval": "60m"
      },
      "terms": {
         "fields": ["node"]
      }
   },
   "metrics": [
      {
         "field": "temperature",
         "metrics": ["min", "max", "sum"]
      },
      {
         "field": "voltage",
         "metrics": ["avg"]
      }
   ]
}

cron 매개변수는 작업의 활성화 시간과 활성화 주기를 제어합니다. 수집 작업의 cron 계획이 트리거되면, 마지막 활성화 이후로부터 중단된 곳에서 수집을 시작합니다.

작업이 실행되고 데이터를 처리한 후, DSL 쿼리를 사용하여 몇 가지 검색을 수행할 수 있습니다.

GET /sensor_rollup/_rollup_search
{
   "size": 0,
   "aggregations": {
      "max_temperature": {
         "max": {
            "field": "temperature"
         }
      }
   }
}