Сравнительная таблица, которую мы видели в предыдущей главе, в значительной степени завершает указатели. Apache Flink — наиболее подходящая среда для обработки и использования в реальном времени. Уникальная система с одним ядром позволяет обрабатывать как пакетные, так и потоковые данные с помощью различных API, таких как Dataset и DataStream.
Это не означает, что Hadoop и Spark выходят из игры, выбор наиболее подходящей среды больших данных всегда зависит и варьируется от варианта использования к варианту использования. Может быть несколько вариантов использования, в которых может быть подходящей комбинация Hadoop и Flink или Spark и Flink.
Тем не менее, Flink является лучшей платформой для обработки в реальном времени. Рост Apache Flink был удивительным, и число участников его сообщества растет день ото дня.
Счастливого мигания!