Учебники

Кибана — агрегация и метрика

Во время изучения Кибаны вы часто сталкиваетесь с двумя терминами: Bucket и Metrics Aggregation. В этой главе обсуждается, какую роль они играют в Кибане, и более подробно о них.

Что такое агрегация кибана?

Агрегация — это совокупность документов или набор документов, полученных из определенного поискового запроса или фильтра. Агрегация формирует основную концепцию построения желаемой визуализации в Кибане.

Всякий раз, когда вы выполняете какую-либо визуализацию, вам необходимо определить критерии, которые означают, каким образом вы хотите сгруппировать данные для выполнения метрики на них.

В этом разделе мы обсудим два типа агрегации:

  • Агрегация ковшей
  • Метрическая агрегация

Агрегация ковшей

Ведро в основном состоит из ключа и документа. Когда агрегирование выполнено, документы помещаются в соответствующее ведро. Таким образом, в конце у вас должен быть список сегментов, каждый со списком документов. Список Bucket Aggregation, который вы увидите при создании визуализации в Kibana, показан ниже —

Агрегация ковшей

Bucket Aggregation имеет следующий список —

  • Гистограмма даты
  • Диапазон дат
  • фильтры
  • Гистограмма
  • Диапазон IPv4
  • Спектр
  • Существенные условия
  • термины

При создании необходимо выбрать один из них для объединения сегментов, т. Е. Группировать документы внутри сегментов.

В качестве примера для анализа рассмотрим данные по странам, которые мы загрузили в начале этого урока. Поля, доступные в индексе стран — это название страны, площадь, население, регион. В данных по странам у нас есть название страны вместе с населением, регионом и территорией.

Допустим, нам нужны данные по регионам. Затем страны, доступные в каждом регионе, становятся нашим поисковым запросом, поэтому в этом случае регион будет формировать наши корзины. Приведенная ниже блок-схема показывает, что R1, R2, R3, R4, R5 и R6 — это сегменты, которые мы получили, а c1, c2 ..c25 — список документов, которые являются частью сегментов R1-R6.

Агрегирование блок-схем

Мы видим, что в каждом ведре есть несколько кругов. Они представляют собой набор документов, основанных на критериях поиска и считающихся падающими в каждое ведро. В корзине R1 у нас есть документы c1, c8 и c15. Эти документы являются странами, которые попадают в этот регион, то же самое для других. Таким образом, если мы посчитаем страны в Ведре R1, это 3, 6 для R2, ​​6 для R3, 2 для R4, 5 для R5 и 4 для R6.

Таким образом, с помощью агрегирования сегментов мы можем агрегировать документы в сегменты и получать список документов в этих сегментах, как показано выше.

Список агрегации ведра, который у нас есть, —

  • Гистограмма даты
  • Диапазон дат
  • фильтры
  • Гистограмма
  • Диапазон IPv4
  • Спектр
  • Существенные условия
  • термины

Давайте теперь обсудим, как формировать эти ведра по одному подробно.

Гистограмма даты

Агрегирование гистограммы даты используется в поле даты. Таким образом, индекс, который вы используете для визуализации, если у вас есть поле даты в этом индексе, может использоваться только этот тип агрегации. Это агрегация с несколькими сегментами, что означает, что некоторые документы могут быть частью более одного сегмента. Для этой агрегации необходимо использовать интервал, подробности которого приведены ниже:

Гистограмма даты

Когда вы выбираете объединение сегментов в качестве гистограммы даты, будет отображаться параметр Поле, в котором будут отображаться только поля, связанные с датой. После того, как вы выбрали свое поле, вам нужно выбрать интервал, который имеет следующие детали —

Выберите интервальную гистограмму

Таким образом, документы из индекса, выбранного и основанного на выбранном поле и интервале, будут классифицировать документы по группам. Например, если вы выбрали интервал как ежемесячный, документы, основанные на дате, будут конвертированы в сегменты и на основе месяца, т.е. января-декабря, документы будут помещены в сегменты. Здесь январь, февраль, декабрь будут ведрами.

Диапазон дат

Вам нужно поле даты, чтобы использовать этот тип агрегации. Здесь у нас будет диапазон дат, то есть от даты и до даты. Ведра будут иметь свои документы на основе формы и на сегодняшний день.

Диапазон дат

фильтры

При агрегации типов фильтров сегменты будут формироваться на основе фильтра. Здесь вы получите несколько сегментов, сформированных на основе критериев фильтрации, когда один документ может существовать в одном или нескольких сегментах.

Используя фильтры, пользователи могут писать свои запросы в опции фильтра, как показано ниже —

фильтры

Вы можете добавить несколько фильтров на ваш выбор с помощью кнопки Добавить фильтр.

Гистограмма

Этот тип агрегации применяется к числовому полю и группирует документы в сегменте на основе примененного интервала. Например, 0-50,50-100,100-150 и т. Д.

Гистограмма

Диапазон IPv4

Этот тип агрегации используется и в основном используется для IP-адресов.

Диапазон IPv4

Индекс, который у нас есть, это contriesdata-28.12.2018, не имеет поля типа IP, поэтому он отображает сообщение, как показано выше. Если у вас есть поле IP, вы можете указать в нем значения От и До, как показано выше.

Спектр

Этот тип агрегации требует, чтобы поля имели номер типа. Вам необходимо указать диапазон, и документы будут перечислены в списках, попадающих в диапазон.

Вы можете добавить больше диапазона, если требуется, нажав на кнопку Добавить диапазон.

Существенные условия

Этот тип агрегации в основном используется в строковых полях.

Существенные условия

термины

Этот тип агрегации используется во всех доступных полях, а именно: число, строка, дата, логическое значение, IP-адрес, отметка времени и т. Д. Обратите внимание, что это агрегация, которую мы собираемся использовать во всей нашей визуализации, над которой мы будем работать в этом руководство.

термины

У нас есть опционный порядок, по которому мы будем группировать данные на основе выбранной метрики. Размер относится к количеству сегментов, которые вы хотите отобразить в визуализации.

Далее, давайте поговорим о метрической агрегации.

Метрическая агрегация

Метрическая агрегация в основном относится к математическим расчетам, выполненным для документов, представленных в корзине. Например, если вы выбираете числовое поле, вычисление метрики, которое вы можете сделать, это COUNT, SUM, MIN, MAX, AVERAGE и т. Д.

Список агрегации метрик, который мы обсудим, приведен здесь —

Метрическая агрегация

В этом разделе давайте обсудим важные из них, которые мы будем часто использовать —

  • Средний
  • подсчитывать
  • Максимум
  • Min
  • сумма

Метрика будет применяться к агрегации отдельных сегментов, о которой мы уже говорили выше.

Далее, давайте обсудим список агрегирования метрик здесь —

Средний

Это даст среднее значение для документов, представленных в корзинах. Например —

Средний

R1 — R6 — ведра. В R1 у нас есть c1, c8 и c15. Рассмотрим значение с1, равное 300, с8, равное 500, и с15, равное 700. Теперь, чтобы получить среднее значение корзины R1

R1 = значение c1 + значение c8 + значение c15 / 3 = 300 + 500 + 700/3 = 500.

В среднем 500 за ведро R1. Здесь значение документа может быть таким, как если бы вы рассматривали данные стран, это может быть область страны в этом регионе.

подсчитывать

Это даст количество документов, представленных в ведре. Предположим, вы хотите подсчитать количество стран, присутствующих в регионе, это будет общее количество документов, представленных в корзинах. Например, R1 будет 3, R2 = 6, R3 = 5, R4 = 2, R5 = 5 и R6 = 4.

Максимум

Это даст максимальное значение документа, представленного в корзине. Рассматривая приведенный выше пример, если у нас есть данные по странам в области региона. Максимумом для каждого региона будет страна с максимальной площадью. Таким образом, он будет иметь одну страну от каждого региона, то есть от R1 до R6.

в

Это даст минимальное значение документа, представленного в корзине. Рассмотрим приведенный выше пример, если у нас есть данные по странам в области региона. Мин для каждого региона будет страна с минимальной площадью. Таким образом, он будет иметь одну страну от каждого региона, то есть от R1 до R6.

сумма

Это даст сумму значений документа, представленного в корзине. Например, если вы рассмотрите приведенный выше пример, если нам нужна общая площадь или страны региона, это будет сумма документов, представленных в регионе.

Например, чтобы узнать общее количество стран в регионе, R1 будет равно 3, R2 = 6, R3 = 5, R4 = 2, R5 = 5 и R6 = 4.

В случае, если у нас есть документы с областью в регионе, то от R1 до R6 будет суммирована область страны для региона.