Учебники

5) Обработка таблиц в HBase

В HBase мы можем создавать табличные операции двумя способами

  • Команда Shell
  • JAVA API

Мы научимся использовать оба для создания таблиц.

HBase создать таблицу с Java API

В этом разделе мы собираемся выполнить некоторые операции, используя Java- кодирование через Java API.

С помощью Java API мы можем создавать таблицы в HBase, а также загружать данные в таблицы с использованием Java-кодирования.

  • Установление соединения с HBase через Java API
  • Использование Eclipse для кодирования, отладки и тестирования Java

Установление соединения через Java API:

Следующие шаги помогут нам разработать код Java для подключения HBase через Java API.

Шаг 1) На этом шаге мы собираемся создать проект Java в eclipse для соединения HBase.

Создание нового имени проекта «HbaseConnection» в затмении.

Для Java проекта, связанного с настройкой или созданием программы

Создание, вставка, чтение таблиц в HBase

Если мы наблюдаем скриншот выше.

  1. Дайте название проекта в этом поле. В нашем случае у нас есть название проекта «HbaseConnection»
  2. Установите этот флажок для местоположения по умолчанию, которое будет сохранено. В этом / home / hduser / work / HbaseConnection есть путь
  3. Установите флажок для среды Java здесь. В этом JavaSE-1.7 является выпуском Java
  4. Выберите ваш вариант, где вы хотите сохранить файл. В нашем случае мы выбрали второй вариант «Создать отдельную папку для исходных файлов и файлов классов».
  5. Нажмите на кнопку Готово.
  • Когда вы нажимаете кнопку Готово, он собирается создать проект HbaseConnection в Eclipse.
  • Он сразу перейдет на домашнюю страницу затмения после нажатия кнопки «Готово».

Шаг 2) На домашней странице Eclipse выполните следующие шаги

Right click on project -> Select Build Path -> Configure build path

Создание, вставка, чтение таблиц в HBase

Сверху скриншот

  1. Щелкните правой кнопкой мыши на проекте
  2. Выберите путь сборки
  3. Выберите настроить путь сборки

После нажатия Configure Build path, он откроет другое окно, как показано на скриншоте ниже

На этом этапе мы добавим соответствующие jar-файлы HBase в проект java, как показано на скриншоте.

  • Важные jar для добавления hbase-0.94.8.jar, hadoop-core-1.1.2.jar
  • Нажмите на кнопку Готово

Создание, вставка, чтение таблиц в HBase

  1. Приходите в библиотеки
  2. Нажмите опцию — Добавить внешние банки
  3. Выберите необходимые важные банки
  4. Нажмите кнопку «Готово», чтобы добавить эти файлы в ‘src’ проекта Java под библиотеками.

После добавления этих банок, он будет отображаться в месте расположения проекта «src». Все файлы Jar, попадающие под проект, теперь готовы для использования с экосистемой Hadoop.

Шаг 3) На этом шаге, используя HBaseConnection.java, HBase-соединение будет установлено через Java Coding

  • В верхнем меню Eclipse выполните программу Java, как показано ниже

    Выполнить -> Выполнить как -> Java-приложение

    Создание, вставка, чтение таблиц в HBase

  1. Выберите Run
  2. Выберите «Запустить как приложение Java».
  • Этот код установит соединение с HBase через Java API
  • После выполнения этого кода в HBase будет создана таблица «guru99» с двумя семействами столбцов с именами «образование» и «проекты». В настоящее время пустая схема создается только в HBase.

Создание, вставка, чтение таблиц в HBase

На скриншоте выше мы выполняем следующие функции.

  1. Используя HTableDescriptor, мы можем создать таблицу «guru99» в HBase
  2. Используя метод addFamily, мы собираемся добавить «образование» и «проекты» в качестве имен столбцов в таблицу «guru99».

Ниже кодирование собирается

  • Установите соединение с HBase и
  • Создать таблицу «guru99» с двумя столбцами

Код, размещенный в документе HBaseConnection_Java

// Place this code inside Hbase connection
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;						
import org.apache.hadoop.hbase.HBaseConfiguration;							
import org.apache.hadoop.hbase.HColumnDescriptor;							
import org.apache.hadoop.hbase.HTableDescriptor;		
Import org.apache.hadoop.hbase.client.HBaseAdmin;							

public class HBaseConnection							
{							
    public static void main(String[] args) throws IOException						
    {							
	HBaseConfigurationhc = new HBaseConfiguration(new Configuration());										
	HTableDescriptorht = new HTableDescriptor("guru99"); 										

	ht.addFamily( new HColumnDescriptor("education"));					
	ht.addFamily( new HColumnDescriptor("projects"));										
	System.out.println( "connecting" );										
	HBaseAdminhba = new HBaseAdmin( hc );								

	System.out.println( "Creating Table" );								
	hba.createTable( ht );							
	System.out.println("Done......");										
    }						
}

Это обязательный код, который вы должны поместить в HBaseConnection.java и запустить Java-программу.

После запуска этой программы она собирается установить соединение с HBase и, в свою очередь, создаст таблицу с именами столбцов.

  • Название таблицы «guru99»
  • Названия столбцов «образование» и «проекты»

Шаг 4) Мы можем проверить, создана ли таблица «guru99» с двумя столбцами в HBase или нет, используя режим оболочки HBase с командой «list».

Команда «list» предоставляет информацию обо всех таблицах, созданных в HBase.

На этом экране мы собираемся сделать

  • Проверка кода в оболочке HBase путем выполнения команды «list».
  • Если мы запустим команду «list», она отобразит таблицу, созданную в HBase, как показано ниже. В нашем случае мы видим, что таблица «guru99» создана

Создание, вставка, чтение таблиц в HBase

HBase Создать таблицу с Shell

Синтаксис для создания таблицы

Syntax: create <tablename>, <columnfamilyname>

HBase Shell и общие команды

Пример:-

hbase(main):001:0> create 'education' ,'guru99'
0 rows(s) in 0.312 seconds
=>Hbase::Table – education

Приведенный выше пример объясняет, как создать таблицу в HBase с указанным именем, данным в соответствии со словарем или спецификациями в соответствии с семейством столбцов. В дополнение к этому, мы также можем передать некоторые атрибуты области таблицы.

create 'guru99', {NAME=>'Edu', VERSIONS=>213423443}

Резюме:

HBase — это ориентированная на столбцы база данных NoSQL для хранения большого объема данных поверх экосистемы Hadoop. Обработка таблиц в HBase — очень важная вещь, потому что все важные функции, такие как операции с данными, усовершенствования данных и моделирование данных, мы можем выполнять только через таблицы в HBase. Таблицы выполняют следующие функции 1) Создание таблиц с именами столбцов и строками 2) Вставка значений в таблицы 3) Извлечение значений из таблиц