Flume — это стандартный, простой, надежный, гибкий и расширяемый инструмент для ввода данных от различных производителей данных (веб-серверов) в Hadoop. В этом уроке мы будем использовать простой и иллюстративный пример, чтобы объяснить основы Apache Flume и как использовать его на практике.
Аудитория
Это руководство предназначено для всех тех специалистов, которые хотели бы изучить процесс передачи журналов и потоковой передачи данных с различных веб-серверов на HDFS или HBase с использованием Apache Flume.
Предпосылки
Чтобы максимально использовать этот учебник, вы должны хорошо разбираться в основах команд Hadoop и HDFS.