Статьи

Сбор журналов в Azure Databricks

Azure Databricks — аналитическая платформа на основе Apache Spark, оптимизированная для платформы облачных сервисов Microsoft Azure. В этом блоге мы увидим, как мы можем собирать журналы из Azure в ALA. Прежде чем идти дальше, нам нужно посмотреть, как настроить кластер Spark в Azure.

Создать Spark-кластер в Databricks

  1. На портале Azure перейдите в созданную вами рабочую область Databricks и нажмите Launch Workspace.
  2. Вы будете перенаправлены на портал Azure Databricks. На портале нажмите Новый кластер.
  3. В разделе «Дополнительные параметры» щелкните вкладку «Начальные сценарии». Перейдите к последней строке в разделе «Сценарии инициализации». В раскрывающемся списке «Место назначения» выберите «DBFS» и введите «dbfs: /databricks/spark-monitoring/spark-monitoring.sh» в текстовом поле. Нажмите кнопку «Добавить». 

Запустить задание Spark SQL

  1. На левой панели выберите Блоки данных Azure. Из общих задач выберите New Notebook.
  2. В диалоговом окне «Создать блокнот» введите имя, выберите язык и выберите кластер Spark, созданный ранее.

Вам также может понравиться: Выполнение заданий ML в Azure Databricks From Streamsets


Создать блокнот

  1. Нажмите кнопку Рабочая область 
  2. В диалоговом окне «Создать блокнот» введите имя и выберите язык по умолчанию для блокнота.
  3. Работают кластеры, отображается раскрывающийся список кластеров. Выберите кластер.

Добавление Logger в блокнот DataBricks


Джава