Учебники

8) Hbase Интервью Вопросы

Ниже приведены часто задаваемые вопросы в интервью для новичков и опытных разработчиков HBase.

1) Объясните, что такое Hbase?

Hbase — это система управления базами данных, ориентированная на столбцы, которая работает поверх HDFS (Hadoop Distribute File System). Hbase не является хранилищем реляционных данных и не поддерживает язык структурированных запросов, такой как SQL.

В Hbase главный узел регулирует серверы кластера и региона для хранения частей таблиц и управляет работой с данными.

2) Объясните, зачем использовать Hbase?

  • Система хранения большой емкости
  • Распределенный дизайн для обслуживания больших столов
  • Колонно-ориентированные магазины
  • Горизонтально масштабируемый
  • Высокая производительность и доступность
  • Основная цель Hbase — миллионы столбцов, тысячи версий и миллиарды строк
  • В отличие от HDFS (Hadoop Distribute File System), он поддерживает случайные операции CRUD в реальном времени

3) Укажите, какие ключевые компоненты Hbase?

  • Zookeeper: он выполняет координацию между клиентом и Hbase Maser
  • Hbase Master: Hbase Master контролирует региональный сервер
  • RegionServer: RegionServer контролирует регион
  • Регион: Содержит в памяти данные хранилища (MemStore) и Hfile.
  • Таблицы каталогов: Таблицы каталогов состоят из ROOT и META

4) Объясните, из чего состоит Hbase?

  • Hbase состоит из набора таблиц
  • И каждая таблица содержит строки и столбцы, как в традиционной базе данных
  • Каждая таблица должна содержать элемент, определенный как первичный ключ
  • Столбец Hbase обозначает атрибут объекта

5) Укажите, сколько рабочих команд в Hbase?

Оперативная команда в Hbases составляет около пяти типов

  • Получить
  • Положил
  • удалять
  • сканирование
  • инкремент

6) Объясните, что такое WAL и Hlog в Hbase?

WAL (Write Ahead Log) похож на журнал MySQL BIN; он записывает все изменения происходят в данных. Это стандартный файл последовательности Hadoop, в котором хранятся файлы HLogkey. Эти ключи состоят из порядкового номера, а также фактических данных и используются для воспроизведения еще не сохраненных данных после сбоя сервера. Таким образом, за счет отказа сервера WAL работает как линия жизни и восстанавливает потерянные данные.

7) Когда вы должны использовать Hbase?

  • Размер данных огромен: когда у вас есть тонны и миллионы записей для работы
  • Полный редизайн: когда вы переводите RDBMS в Hbase, вы рассматриваете его как полный редизайн, а не просто изменение портов
  • Команды без SQL: у вас есть несколько функций, таких как транзакции; внутренние объединения, типизированные столбцы и т. д.
  • Инвестиции в инфраструктуру: вам нужно достаточно кластера, чтобы Hbase был действительно полезным

8) Что такое семейства столбцов в Hbase?

Семейства столбцов составляют базовую единицу физической памяти в Hbase, к которой применяются такие функции, как сжатия.

9) Объясните, что такое ключ строки?

Ключ строки определяется приложением. Поскольку комбинированный ключ предварительно фиксируется ключом строки, он позволяет приложению определить желаемый порядок сортировки. Это также позволяет логически сгруппировать ячейки и убедиться, что все ячейки с одним и тем же ключом строки расположены на одном сервере.

10) Объясните удаление в Hbase? Упомяните, каковы три типа маркеров надгробий в Hbase?

Когда вы удаляете ячейку в Hbase, данные на самом деле не удаляются, а устанавливается маркер захоронения, что делает удаленные ячейки невидимыми. Удаленные Hbase фактически удаляются во время уплотнения.

Есть три типа маркеров надгробий:

  • Маркер удаления версии: для удаления помечает одну версию столбца
  • Маркер удаления столбца: для удаления он помечает все версии столбца.
  • Маркер удаления семейства: для удаления помечает все столбцы для семейства столбцов.

11) Объясните, как на самом деле Hbase удаляет строку?

В Hbase все, что вы записываете, будет храниться из ОЗУ на диск, эти записи на диск являются неизменными, за исключением сжатия. Во время процесса удаления в Hbase основной процесс уплотнения удаляет маркер, в то время как второстепенный — нет. При обычном удалении это приводит к удалению надгробного маркера — эти данные удаления, которые они представляют, удаляются во время сжатия.

Кроме того, если вы удаляете данные и добавляете больше данных, но с более ранней отметкой времени, чем отметка времени надгробной плиты, дополнительные значения Gets могут быть замаскированы маркером удаления / надгробной плиты, и, следовательно, вы не получите вставленное значение до окончания основного уплотнения.

12) Объясните, что произойдет, если вы измените размер блока семейства столбцов в уже занятой базе данных?

При изменении размера блока семейства столбцов новые данные занимают новый размер блока, в то время как старые данные остаются в пределах старого размера блока. Во время сжатия данных старые данные будут иметь новый размер блока. Новые файлы по мере их очистки имеют новый размер блока, в то время как существующие данные будут по-прежнему считываться правильно. Все данные должны быть преобразованы в новый размер блока после следующего крупного уплотнения.

13) Укажите разницу между Hbase и реляционной базой данных?

Hbase Реляционная база данных
  • Это без схемы
  • Это ориентированное на столбцы хранилище данных
  • Используется для хранения ненормализованных данных
  • Содержит малонаселенные таблицы
  • Автоматическое разбиение осуществляется в Hbase
  •  Это база данных на основе схемы
  • Это ориентированное на строки хранилище данных
  • Используется для хранения нормализованных данных
  • Содержит тонкие столы
  • Нет такого положения или встроенной поддержки для разделения

14) Что такое класс HBaseFsck?

В HBase доступно имя инструмента с именем back, которое реализуется классом HBaseFsck. Он предлагает несколько параметров командной строки, которые влияют на его поведение.

15) Каковы основные ключевые структуры HBase?

Ключ строки и ключ столбца — это две наиболее важные структуры ключей, используемые в HBase

16) Обсудите, как вы можете использовать фильтры в Apache HBase

Фильтры в HBase Shell. Он был представлен в Apache HBase 0.92, который помогает вам выполнять фильтрацию на стороне сервера для доступа к HBase через оболочку или экономию HBase.

17) HBase поддерживает структуру синтаксиса, такую ​​как SQL да или нет?

Нет, к сожалению, поддержка SQL для HBase в настоящее время недоступна. Однако, используя Apache Phoenix, мы можем получать данные из HBase с помощью SQL-запросов.

18) Что означает сжатие в HBase?

Во время интенсивной входящей записи невозможно достичь оптимальной производительности, имея один файл на хранилище. HBase помогает вам объединить все эти файлы HFiles, чтобы уменьшить количество затравочных дисков для каждого чтения. Этот процесс известен как Уплотнение в HBase.

19) Как вы будете реализовывать соединения в HBase?

HBase, не поддерживающий соединения напрямую, но использующий запросы соединения заданий MapReduce, может быть реализован путем извлечения данных с помощью различных таблиц HBase.

20) Объясните JMX относительно HBSE

Java Management Extensions или JMX — это статус экспорта Java-приложений, являющихся для них стандартом.

21) Какая польза от MasterServer?

Мастер-сервер также поможет вам назначить регион серверу региона. Это также поможет вам справиться с балансировкой нагрузки, которую мы используем MasterServer.

22) Определите термин «бережливость»

Apache Thrift написан на C ++. Он предоставляет компиляторы схем для различных языков программирования, таких как C ++, Perl, PHP, Python, Ruby и других.

23) Зачем использовать класс HColumnDescriptor?

Подробности относительно семейства столбцов, такие как параметры сжатия, Количество версий, хранятся в. HColumnDescriptor.

24) Что такое клетка в HBase?

Ячейка в HBase — это самая маленькая единица таблицы Hbase. Это поможет вам сохранить часть данных в виде кортежа {строка, столбец, версия}

25) Что такое фильтр Блума?

HBase поддерживает Bloom Filter и позволяет повысить общую пропускную способность кластера. HBase Bloom Filter — это эффективный механизм, позволяющий проверить, содержит ли HFile определенную строку или ячейку строки-столбца.

26) Расскажите мне о типах операций HBase?

Отв. Два типа операций HBase:

  • Операция чтения
  • Операция записи

27) Какая польза от HBase HMaster?

Основные обязанности мастера:

  1. Координация серверов региона
  2. Функции администратора

28) Какой метод вы можете использовать в HBase для прямого доступа к HFile без помощи HBase?

Чтобы получить прямой доступ к HFile без использования HBase, мы используем метод HFile.main ().

29) Может региональный сервер будет расположен на всех узлах данных?

 Да, серверы региона работают на тех же серверах, что и узлы данных

30) Назовите фильтр, который принимает размер страницы в качестве параметра в HBase

Фильтр с именем PageFilter принимает размер страницы в качестве параметра.

Этот документ был составлен с использованием инструментов мгновенного преобразования HTML.