Учебники

Учебник Talend

Что такое Таленд?

Talend — это программная платформа с открытым исходным кодом, которая предлагает решения для интеграции данных и управления данными. Talend специализируется на интеграции больших данных. Инструмент предоставляет такие функции, как облако, большие данные, интеграция корпоративных приложений, качество данных и управление основными данными. Он также предоставляет единый репозиторий для хранения и повторного использования метаданных.

Он доступен как с открытым исходным кодом, так и в премиум-версии. Это один из лучших инструментов для облачных вычислений и интеграции больших данных.

В этом уроке вы узнаете

История Таленда:

Год веха
2002 R & D
2005 Создание компании — Первый раунд финансирования AGF private equity & Galle Partners
2006 Open Studio V1.0 — запущенные нами операции
2007 Интеграционный пакет / закрытый второй раунд финансирования
2008 Открыть Профилировщик / Качество данных
2009 Integration Suite RTx / MPx / MDM приобретение
2010 IDM Community Edition / MDM Enterprise Edition
Открытая студия V
2014 OW2 Лучший проект
2015 Признанный Trendsetting продукт
2016 DBTA 100
2017 Gartner Magic Quadrant для инструментов интеграции данных

Talend Product Suite:

Наборы продуктов Talend состоят из 3 основных продуктов, как описано ниже:

Talend Big Data:

Talend может легко автоматизировать интеграцию больших данных с помощью графических инструментов и мастеров. Это позволяет организации разрабатывать среду для удобной работы с базами данных Apache Hadoop, Spark и NoSQL для облачных или локальных заданий.

Сегодня многие компании используют Hadoop для экономии средств и повышения производительности. Часто компании используют дорогое время вычислений с корпоративными решениями. С помощью Hadoop данные могут быть преобразованы, очищены, обогащены и интегрированы для более высокой аналитической рабочей нагрузки.

Песочница Talend включает четыре варианта использования

  1. Оптимизация хранилища данных
  2. Аналитика кликов
  3. Анализ настроений в социальных сетях
  4. Аналитика веб-блогов Apache.

Вы можете создавать свои собственные сложные варианты использования.

Преимущества Talend для больших данных Hadoop

  • Повышение эффективности проектирования заданий на большие данные путем организации и настройки в графическом интерфейсе.
  • Добавляет качество данных, масштабируемость и функции управления
  • Функция MapReduce позволяет быстрее параллельной обработки данных
  • Общий репозиторий и удаленное развертывание
  • Качество данных и профилирование с очисткой данных
  • Повышает эффективность проектирования больших данных с помощью графического интерфейса
  • Встроенная поддержка HBase, HDFS, Hive, Sqoop, Mahout и Pig
  • Встроенный в платформу данных Hortonworks

Интеграция данных:

Программный инструмент интеграции данных Talend имеет открытую масштабируемую архитектуру. Это позволяет быстрее реагировать на бизнес-запросы. Инструмент предлагает разрабатывать и развертывать задания по интеграции данных быстрее, чем ручное кодирование.

Это позволяет вам легко интегрировать все ваши данные с другими хранилищами данных или синхронизировать данные между системами. Интеграция данных включает в себя объединение данных, хранящихся в разных источниках, и предоставление пользователям единого представления этих данных. Он помогает вам управлять различными заданиями ETL и предоставляет пользователям простую подготовку данных самообслуживания.

Преимущества Talend для интеграции данных

Гибкая интеграция: более быстрая реакция на бизнес-запросы без написания кода с использованием более 1000 готовых соединителей, графических инструментов на основе Eclipse и оптимизированного для производительности генератора кода.

Производительность команды: совместная работа с использованием мощного управления версиями, анализа последствий, тестирования и отладки, а также управления метаданными.

Простое управление: инструмент предлагает расширенные функции планирования и мониторинга. Он обеспечивает интеграцию данных в реальном времени с панелями мониторинга и централизованным управлением для быстрого развертывания на нескольких узлах.

Будьте впереди в конкурентной борьбе: если вы используете этот инструмент, вам не придется ждать использования новейших и самых крутых функций интеграции данных.

Платите самую низкую цену за владение: Talend предлагает модель оценки на основе подписки. Вам нужно заплатить за количество разработчиков, использующих Talend Studio, тем самым сэкономив деньги по сравнению с фиксированным лицензированием.

Облако интеграции:

Вы можете ускорить проекты по интеграции облачных и локальных данных с помощью масштабируемой и безопасной облачной платформы интеграции как услуга (iPaaS). Облачный инструмент интеграции Talend предлагает возможность подключения, качество встроенных данных и генерацию собственного кода.

Talend — это защищенная облачная платформа интеграции, которая позволяет ИТ-специалистам и бизнес-пользователям подключаться к общим и локальным ресурсам. Он открывает возможности облачного проектирования, поскольку он может управлять, контролировать и контролировать в облаке.

Льготы:

Облако интеграции Talend Другие инструменты
900+ компонентов drag-n-drop Ручное кодирование, которое непродуктивно
Создает оптимизированный код Нужны специализированные навыки
Сотрудничество и управление Трудно поддерживать
Золотая поддержка (SLA) Ограниченная поддержка

Что такое Talend Open Studio?

Talend Open Studio — это открытая архитектура для интеграции данных, профилирования данных, больших данных, облачной интеграции и многого другого.

Это среда графического интерфейса, которая предлагает более 1000 готовых разъемов. Это облегчает выполнение таких операций, как преобразование файлов, загрузка данных, перемещение и переименование файлов. Это позволяет каждому компоненту определять сложные процессы.

Интеграционные задания создаются из компонентов, которые настроены, а не закодированы. Кроме того, задания можно запускать из среды разработки или в виде автономных сценариев.

Преимущества использования Talend Open studio:

  • Это сокращает время, необходимое для разработки интеграции, с недель и месяцев до дней или даже часов.
  • Он преобразует и обновляет данные, представленные из различных источников.
  • Мониторинг и управление сложными развертываниями с легкостью
  • Вы можете иметь самую низкую стоимость владения любым решением
  • Talend Open Source может легко комбинировать, конвертировать и обновлять данные, представленные из различных источников.
  • Инструмент Talend Open Source наследует потенциальную мощь программной платформы.
  • Широкий выбор разъемов источника / цели делает его лучшим выбором в отрасли.
  • Поставляется с широкими возможностями файла журнала нескольких схем / отчета о сверке (поток данных после переноса / миграция)
Legacy ETL Talend
Собственность Двигатель открыто
Трудно масштабировать большие данные Создает собственный код
Дорогой Низкая стоимость владения

Talend Open Studio- Архитектура:

Ниже приведены 3 ключевых компонента архитектуры Talend Open Studio.

Клиенты:

Блок Clients включает в себя один или несколько Talend Studio и веб-браузеры, которые используют одни и те же или разные компьютеры. Talend Studio позволяет выполнять процессы интеграции данных независимо от уровня объемов данных и сложности процесса.

Talend Server:

Сервер Talend является еще одним важным блоком, который включает сервер веб-приложений. Это позволяет администрирование и сопровождение всех проектов. Он включает в себя учетные записи пользователей, права доступа и авторизацию проекта в базе данных администрирования.

База данных:

Компонент Базы данных включает в себя Администрирование, Аудит и Мониторинг баз данных. Этот компонент помогает управлять учетными записями пользователей, правами доступа и авторизацией проектов. База данных аудита помогает оценить различные аспекты рабочих мест для разработки идеальной системы поддержки принятия решений, ориентированной на процессы.

Рабочее пространство:

В Talend рабочее пространство — это каталог, в котором хранятся все папки проекта. Однако для этого вам потребуется по крайней мере один каталог рабочей области на соединение (соединение с репозиторием). Talend позволяет подключаться к различным каталогам рабочей области, если вы не хотите использовать каталоги по умолчанию.

Repository:

Хранилище — это область хранения, которую инструмент TOS использует для сбора данных для объяснения бизнес-моделей или для разработки рабочих мест.

Расширения Talend Open Studio

  • Talend Integration Suite
  • Talend On Demand
  • Качество данных Talend
  • Таленд ESB
  • Talend Big Data Integration

Вывод:

  • Talend — это программная платформа с открытым исходным кодом, которая предлагает решения для интеграции данных и управления данными
  • Talend может легко автоматизировать интеграцию больших данных с помощью графических инструментов и мастеров
  • Talend Product Suite состоит из 3 основных продуктов 1) Talend Big Data 2) Интеграция данных 3) Облако интеграции
  • Talend повышает эффективность проектирования заданий на большие данные путем организации и настройки в графическом интерфейсе
  • Программный инструмент интеграции данных Talend имеет открытую масштабируемую архитектуру. Это позволяет быстрее реагировать на бизнес-запросы.
  • Облачный инструмент интеграции Talend предлагает возможность подключения, качество встроенных данных и генерацию собственного кода.
  • Talend Open Studio — это открытая архитектура для интеграции данных, профилирования данных, больших данных, облачной интеграции и многого другого.
  • Пять расширений студии Talend: Talend Integration Suite, Talend On Demand, Качество данных Talend, Talend Seanad Talend Интеграция больших данных