Во время изучения Кибаны вы часто сталкиваетесь с двумя терминами: Bucket и Metrics Aggregation. В этой главе обсуждается, какую роль они играют в Кибане, и более подробно о них.
Что такое агрегация кибана?
Агрегация — это совокупность документов или набор документов, полученных из определенного поискового запроса или фильтра. Агрегация формирует основную концепцию построения желаемой визуализации в Кибане.
Всякий раз, когда вы выполняете какую-либо визуализацию, вам необходимо определить критерии, которые означают, каким образом вы хотите сгруппировать данные для выполнения метрики на них.
В этом разделе мы обсудим два типа агрегации:
- Агрегация ковшей
- Метрическая агрегация
Агрегация ковшей
Ведро в основном состоит из ключа и документа. Когда агрегирование выполнено, документы помещаются в соответствующее ведро. Таким образом, в конце у вас должен быть список сегментов, каждый со списком документов. Список Bucket Aggregation, который вы увидите при создании визуализации в Kibana, показан ниже —
Bucket Aggregation имеет следующий список —
- Гистограмма даты
- Диапазон дат
- фильтры
- Гистограмма
- Диапазон IPv4
- Спектр
- Существенные условия
- термины
При создании необходимо выбрать один из них для объединения сегментов, т. Е. Группировать документы внутри сегментов.
В качестве примера для анализа рассмотрим данные по странам, которые мы загрузили в начале этого урока. Поля, доступные в индексе стран — это название страны, площадь, население, регион. В данных по странам у нас есть название страны вместе с населением, регионом и территорией.
Допустим, нам нужны данные по регионам. Затем страны, доступные в каждом регионе, становятся нашим поисковым запросом, поэтому в этом случае регион будет формировать наши корзины. Приведенная ниже блок-схема показывает, что R1, R2, R3, R4, R5 и R6 — это сегменты, которые мы получили, а c1, c2 ..c25 — список документов, которые являются частью сегментов R1-R6.
Мы видим, что в каждом ведре есть несколько кругов. Они представляют собой набор документов, основанных на критериях поиска и считающихся падающими в каждое ведро. В корзине R1 у нас есть документы c1, c8 и c15. Эти документы являются странами, которые попадают в этот регион, то же самое для других. Таким образом, если мы посчитаем страны в Ведре R1, это 3, 6 для R2, 6 для R3, 2 для R4, 5 для R5 и 4 для R6.
Таким образом, с помощью агрегирования сегментов мы можем агрегировать документы в сегменты и получать список документов в этих сегментах, как показано выше.
Список агрегации ведра, который у нас есть, —
- Гистограмма даты
- Диапазон дат
- фильтры
- Гистограмма
- Диапазон IPv4
- Спектр
- Существенные условия
- термины
Давайте теперь обсудим, как формировать эти ведра по одному подробно.
Гистограмма даты
Агрегирование гистограммы даты используется в поле даты. Таким образом, индекс, который вы используете для визуализации, если у вас есть поле даты в этом индексе, может использоваться только этот тип агрегации. Это агрегация с несколькими сегментами, что означает, что некоторые документы могут быть частью более одного сегмента. Для этой агрегации необходимо использовать интервал, подробности которого приведены ниже:
Когда вы выбираете объединение сегментов в качестве гистограммы даты, будет отображаться параметр Поле, в котором будут отображаться только поля, связанные с датой. После того, как вы выбрали свое поле, вам нужно выбрать интервал, который имеет следующие детали —
Таким образом, документы из индекса, выбранного и основанного на выбранном поле и интервале, будут классифицировать документы по группам. Например, если вы выбрали интервал как ежемесячный, документы, основанные на дате, будут конвертированы в сегменты и на основе месяца, т.е. января-декабря, документы будут помещены в сегменты. Здесь январь, февраль, декабрь будут ведрами.
Диапазон дат
Вам нужно поле даты, чтобы использовать этот тип агрегации. Здесь у нас будет диапазон дат, то есть от даты и до даты. Ведра будут иметь свои документы на основе формы и на сегодняшний день.
фильтры
При агрегации типов фильтров сегменты будут формироваться на основе фильтра. Здесь вы получите несколько сегментов, сформированных на основе критериев фильтрации, когда один документ может существовать в одном или нескольких сегментах.
Используя фильтры, пользователи могут писать свои запросы в опции фильтра, как показано ниже —
Вы можете добавить несколько фильтров на ваш выбор с помощью кнопки Добавить фильтр.
Гистограмма
Этот тип агрегации применяется к числовому полю и группирует документы в сегменте на основе примененного интервала. Например, 0-50,50-100,100-150 и т. Д.
Диапазон IPv4
Этот тип агрегации используется и в основном используется для IP-адресов.
Индекс, который у нас есть, это contriesdata-28.12.2018, не имеет поля типа IP, поэтому он отображает сообщение, как показано выше. Если у вас есть поле IP, вы можете указать в нем значения От и До, как показано выше.
Спектр
Этот тип агрегации требует, чтобы поля имели номер типа. Вам необходимо указать диапазон, и документы будут перечислены в списках, попадающих в диапазон.
Вы можете добавить больше диапазона, если требуется, нажав на кнопку Добавить диапазон.
Существенные условия
Этот тип агрегации в основном используется в строковых полях.
термины
Этот тип агрегации используется во всех доступных полях, а именно: число, строка, дата, логическое значение, IP-адрес, отметка времени и т. Д. Обратите внимание, что это агрегация, которую мы собираемся использовать во всей нашей визуализации, над которой мы будем работать в этом руководство.
У нас есть опционный порядок, по которому мы будем группировать данные на основе выбранной метрики. Размер относится к количеству сегментов, которые вы хотите отобразить в визуализации.
Далее, давайте поговорим о метрической агрегации.
Метрическая агрегация
Метрическая агрегация в основном относится к математическим расчетам, выполненным для документов, представленных в корзине. Например, если вы выбираете числовое поле, вычисление метрики, которое вы можете сделать, это COUNT, SUM, MIN, MAX, AVERAGE и т. Д.
Список агрегации метрик, который мы обсудим, приведен здесь —
В этом разделе давайте обсудим важные из них, которые мы будем часто использовать —
- Средний
- подсчитывать
- Максимум
- Min
- сумма
Метрика будет применяться к агрегации отдельных сегментов, о которой мы уже говорили выше.
Далее, давайте обсудим список агрегирования метрик здесь —
Средний
Это даст среднее значение для документов, представленных в корзинах. Например —
R1 — R6 — ведра. В R1 у нас есть c1, c8 и c15. Рассмотрим значение с1, равное 300, с8, равное 500, и с15, равное 700. Теперь, чтобы получить среднее значение корзины R1
R1 = значение c1 + значение c8 + значение c15 / 3 = 300 + 500 + 700/3 = 500.
В среднем 500 за ведро R1. Здесь значение документа может быть таким, как если бы вы рассматривали данные стран, это может быть область страны в этом регионе.
подсчитывать
Это даст количество документов, представленных в ведре. Предположим, вы хотите подсчитать количество стран, присутствующих в регионе, это будет общее количество документов, представленных в корзинах. Например, R1 будет 3, R2 = 6, R3 = 5, R4 = 2, R5 = 5 и R6 = 4.
Максимум
Это даст максимальное значение документа, представленного в корзине. Рассматривая приведенный выше пример, если у нас есть данные по странам в области региона. Максимумом для каждого региона будет страна с максимальной площадью. Таким образом, он будет иметь одну страну от каждого региона, то есть от R1 до R6.
в
Это даст минимальное значение документа, представленного в корзине. Рассмотрим приведенный выше пример, если у нас есть данные по странам в области региона. Мин для каждого региона будет страна с минимальной площадью. Таким образом, он будет иметь одну страну от каждого региона, то есть от R1 до R6.
сумма
Это даст сумму значений документа, представленного в корзине. Например, если вы рассмотрите приведенный выше пример, если нам нужна общая площадь или страны региона, это будет сумма документов, представленных в регионе.
Например, чтобы узнать общее количество стран в регионе, R1 будет равно 3, R2 = 6, R3 = 5, R4 = 2, R5 = 5 и R6 = 4.
В случае, если у нас есть документы с областью в регионе, то от R1 до R6 будет суммирована область страны для региона.