Учебники

Teradata – Вопросы и ответы

Уважаемые читатели, эти вопросы для интервью Teradata были разработаны специально для того, чтобы познакомить вас с характером вопросов, с которыми вы можете столкнуться во время интервью по предмету Teradata . Согласно моему опыту, хорошие интервьюеры вряд ли планируют задавать какой-либо конкретный вопрос во время вашего интервью, обычно вопросы начинаются с некоторой базовой концепции предмета, а затем продолжаются на основе дальнейшего обсуждения и того, что вы ответите –

Архитектура Teradata состоит из трех компонентов.

  • Механизм синтаксического анализа – Механизм синтаксического анализа получает запрос от пользователя, анализирует его и подготавливает план выполнения.

  • BYNET – BYNET получает план выполнения от механизма синтаксического анализа и отправляет его в соответствующий AMP.

  • AMP – AMP отвечает за хранение и извлечение строк. Он хранит данные на виртуальном диске, связанном с ним. В дополнение к этому AMP отвечает за управление блокировками, управление пространством, сортировку и агрегацию.

Архитектура Teradata состоит из трех компонентов.

Механизм синтаксического анализа – Механизм синтаксического анализа получает запрос от пользователя, анализирует его и подготавливает план выполнения.

BYNET – BYNET получает план выполнения от механизма синтаксического анализа и отправляет его в соответствующий AMP.

AMP – AMP отвечает за хранение и извлечение строк. Он хранит данные на виртуальном диске, связанном с ним. В дополнение к этому AMP отвечает за управление блокировками, управление пространством, сортировку и агрегацию.

FastLoad Multiload
Целевая таблица должна быть пустой Целевая таблица не должна быть пустой
Только одна таблица может быть загружена с помощью одного скрипта Может загружать / обновлять до 5 таблиц
Поддерживает только оператор CREATE / INSERT Поддерживает до 20 операторов DML в одном скрипте
Не поддерживает таблицы с RI, SI и триггерами Поддерживает таблицы с NUSI

FastLoad обеспечивает возможность перезапуска через контрольные точки. Когда сценарий перезапускается с последней контрольной точки, возможно, что те же строки могут быть снова отправлены в AMP. Вот почему FastLoad не поддерживает дубликаты.

FastLoad обеспечивает возможность перезапуска через контрольные точки. Когда сценарий перезапускается с последней контрольной точки, возможно, что те же строки могут быть снова отправлены в AMP. Вот почему FastLoad не поддерживает дубликаты.

Таблица SET не позволяет дублировать записи, тогда как MULTISET допускает дублирование записей.

Таблица SET не позволяет дублировать записи, тогда как MULTISET допускает дублирование записей.

Для каждой вставленной строки система проверяет, существует ли запись с таким же хешем строки. Если для таблицы определен UPI, она отклонит запись как дубликат. В противном случае он будет сравнивать всю запись на наличие дубликатов. Это серьезно повлияет на производительность системы.

Для каждой вставленной строки система проверяет, существует ли запись с таким же хешем строки. Если для таблицы определен UPI, она отклонит запись как дубликат. В противном случае он будет сравнивать всю запись на наличие дубликатов. Это серьезно повлияет на производительность системы.

Вы можете определить уникальный первичный индекс или уникальный вторичный индекс, чтобы избежать дублирования проверки строк.

Вы можете определить уникальный первичный индекс или уникальный вторичный индекс, чтобы избежать дублирования проверки строк.

Таблицы создаются с помощью оператора CREATE TABLE. Таблицы могут быть созданы с помощью

  • CREATE TABLE оператор с определением столбца.

  • СОЗДАТЬ СТОЛ из существующей таблицы.

  • CREATE TABLE оператор с оператором SELECT.

Таблицы создаются с помощью оператора CREATE TABLE. Таблицы могут быть созданы с помощью

CREATE TABLE оператор с определением столбца.

СОЗДАТЬ СТОЛ из существующей таблицы.

CREATE TABLE оператор с оператором SELECT.

Повторяющиеся записи могут быть идентифицированы с помощью оператора DISTINCT или оператора GROUP BY.

SELECT DISTINCT column 1, column 2… 
FROM tablename;
  
OR
  
SELECT column 1, column 2,… 
FROM tablename 
GROUP BY column 1, column 2….;

Повторяющиеся записи могут быть идентифицированы с помощью оператора DISTINCT или оператора GROUP BY.

  • Первичные ключи не являются обязательными в Teradata, тогда как первичный индекс является обязательным.

  • Распределение данных основано на значении первичного индекса.

  • Первичные ключи не принимают значения NULL, тогда как первичный индекс принимает значения NULL.

  • Первичные ключи являются уникальными, тогда как первичный индекс может быть уникальным (UPI) или неуникальным (NUPI).

  • Первичные ключи не меняются, тогда как первичные индексы меняются.

Первичные ключи не являются обязательными в Teradata, тогда как первичный индекс является обязательным.

Распределение данных основано на значении первичного индекса.

Первичные ключи не принимают значения NULL, тогда как первичный индекс принимает значения NULL.

Первичные ключи являются уникальными, тогда как первичный индекс может быть уникальным (UPI) или неуникальным (NUPI).

Первичные ключи не меняются, тогда как первичные индексы меняются.

Доступ к данным можно получить тремя различными способами:

  • Через первичный индекс
  • Через вторичный индекс
  • Полное сканирование таблицы

Доступ к данным можно получить тремя различными способами:

Это можно определить с помощью запроса SELECT HASHAMP () + 1;

Это можно определить с помощью запроса SELECT HASHAMP () + 1;

Следующий запрос может быть использован для этой цели.

SELECT HASHMAP(HASHBUCKET(HASHROW(primaryindexvalue))), COUNT(*) 
FROM tablename GROUP BY 1; 

Следующий запрос может быть использован для этой цели.

Teradata поддерживает два режима транзакций.

  • Teradata
  • ANSI

Режим Teradata устанавливается с помощью SET SESSION TRANSACTION BTET; Режим ANSI устанавливается с помощью SET SESSION TRANSACTION ANSI;

Teradata поддерживает два режима транзакций.

Режим Teradata устанавливается с помощью SET SESSION TRANSACTION BTET; Режим ANSI устанавливается с помощью SET SESSION TRANSACTION ANSI;

Транзакции могут быть выполнены с использованием операторов BT и ET.

Транзакции могут быть выполнены с использованием операторов BT и ET.

Присоединение к индексам не может быть доступно непосредственно пользователю. Только оптимизатор может получить к ним доступ.

Присоединение к индексам не может быть доступно непосредственно пользователю. Только оптимизатор может получить к ним доступ.

Дублированные записи будут отклонены от загрузки целевых таблиц и будут вставлены в таблицу UV.

Дублированные записи будут отклонены от загрузки целевых таблиц и будут вставлены в таблицу UV.

FALLBACK – это механизм защиты, используемый Teradata для обработки сбоев AMP. Для каждой строки данных другая копия строки хранится в другом AMP в кластере. В случае сбоя любого AMP соответствующие строки будут доступны с помощью FALLBACK AMP.

FALLBACK – это механизм защиты, используемый Teradata для обработки сбоев AMP. Для каждой строки данных другая копия строки хранится в другом AMP в кластере. В случае сбоя любого AMP соответствующие строки будут доступны с помощью FALLBACK AMP.

FALLBACK может быть упомянут при создании таблицы с помощью оператора CREATE TABLE или после создания таблицы с помощью инструкции ALTER TABLE.

FALLBACK может быть упомянут при создании таблицы с помощью оператора CREATE TABLE или после создания таблицы с помощью инструкции ALTER TABLE.

Ошибка пространства в буфере произойдет, если промежуточные результаты запроса превысят ограничение на размер буфера в AMP, установленное для пользователя, отправившего запрос.

Ошибка пространства в буфере произойдет, если промежуточные результаты запроса превысят ограничение на размер буфера в AMP, установленное для пользователя, отправившего запрос.

Команда SLEEP указывает время ожидания перед попыткой Teradata установить соединение.

Команда SLEEP указывает время ожидания перед попыткой Teradata установить соединение.

Команда TENACITY указывает общее время ожидания Teradata для установления нового соединения.

Команда TENACITY указывает общее время ожидания Teradata для установления нового соединения.

Вы можете просто сохранить операторы BEGIN LOADING и END LOADING и отправить скрипт FASTLOAD. Другой вариант – удалить таблицу и снова создать таблицу.

Вы можете просто сохранить операторы BEGIN LOADING и END LOADING и отправить скрипт FASTLOAD. Другой вариант – удалить таблицу и снова создать таблицу.

Кэширование в Teradata работает с источником и остается в том же порядке, то есть не часто меняется. Кэш обычно распределяется между приложениями. Это дополнительное преимущество использования Teradata.

Кэширование в Teradata работает с источником и остается в том же порядке, то есть не часто меняется. Кэш обычно распределяется между приложениями. Это дополнительное преимущество использования Teradata.

RAID – это защитный механизм для обработки сбоя диска. Он обозначает избыточный массив независимых дисков. RAID 1 обычно используется в Teradata.

RAID – это защитный механизм для обработки сбоя диска. Он обозначает избыточный массив независимых дисков. RAID 1 обычно используется в Teradata.

Вторичный индекс предоставляет альтернативный путь для доступа к данным. Они используются, чтобы избежать полного сканирования таблицы. Однако вторичные индексы требуют дополнительной физической структуры для поддержки вложенных таблиц, а также требуют дополнительного ввода-вывода, так как вложенная таблица должна быть обновлена ​​для каждой строки.

Вторичный индекс предоставляет альтернативный путь для доступа к данным. Они используются, чтобы избежать полного сканирования таблицы. Однако вторичные индексы требуют дополнительной физической структуры для поддержки вложенных таблиц, а также требуют дополнительного ввода-вывода, так как вложенная таблица должна быть обновлена ​​для каждой строки.

В Teradata есть четыре разных замка: эксклюзивный, запись, чтение и доступ.

В Teradata есть четыре разных замка: эксклюзивный, запись, чтение и доступ.

Блокировки могут применяться на трех разных уровнях – База данных, Таблица и Строка.

Блокировки могут применяться на трех разных уровнях – База данных, Таблица и Строка.

Используя многозначное сжатие (MVC), вы можете сжать до 255 значений, включая NULL.

Используя многозначное сжатие (MVC), вы можете сжать до 255 значений, включая NULL.

FastLoad загружает данные в блоках по 64 КБ. В FastLoad есть 2 этапа.

  • На этапе 1 он переносит данные в блоки по 64 КБ и отправляет их целевым AMP. Затем каждый AMP будет перераспределять строки по своим целевым AMP.

  • На этапе 2 строки сортируются по порядку их хеширования и записываются в целевую таблицу.

FastLoad загружает данные в блоках по 64 КБ. В FastLoad есть 2 этапа.

На этапе 1 он переносит данные в блоки по 64 КБ и отправляет их целевым AMP. Затем каждый AMP будет перераспределять строки по своим целевым AMP.

На этапе 2 строки сортируются по порядку их хеширования и записываются в целевую таблицу.

Импорт MultiLoad имеет пять этапов.

  • Этап 1 – Предварительный этап – выполняет основные действия по настройке.

  • Этап 2 – этап транзакции DML – проверяет синтаксис операторов DML и переносит их в систему Teradata.

  • Этап 3 – Этап сбора данных – переносит входные данные в рабочие таблицы и блокирует таблицу.

  • Этап 4 – Этап применения – Применяет все операции DML.

  • Фаза 5 – Фаза очистки – Снимает блокировку стола.

Импорт MultiLoad имеет пять этапов.

Этап 1 – Предварительный этап – выполняет основные действия по настройке.

Этап 2 – этап транзакции DML – проверяет синтаксис операторов DML и переносит их в систему Teradata.

Этап 3 – Этап сбора данных – переносит входные данные в рабочие таблицы и блокирует таблицу.

Этап 4 – Этап применения – Применяет все операции DML.

Фаза 5 – Фаза очистки – Снимает блокировку стола.

MULTILOAD DELETE быстрее, так как удаляет записи в блоках. DELETE FROM удалит строку за строкой.

MULTILOAD DELETE быстрее, так как удаляет записи в блоках. DELETE FROM удалит строку за строкой.

Хранимая процедура возвращает одно или несколько значений, тогда как макросы могут возвращать одну или несколько строк. В дополнение к SQL хранимая процедура может содержать операторы SPL.

Хранимая процедура возвращает одно или несколько значений, тогда как макросы могут возвращать одну или несколько строк. В дополнение к SQL хранимая процедура может содержать операторы SPL.

И FastLoad, и MultiLoad загружают данные в блоках по 64 КБ, тогда как BTEQ будет обрабатывать по одной строке за раз.

И FastLoad, и MultiLoad загружают данные в блоках по 64 КБ, тогда как BTEQ будет обрабатывать по одной строке за раз.

FastExport экспортирует данные в блоках по 64 КБ, тогда как BTEQ экспортирует по одной строке за раз.

FastExport экспортирует данные в блоках по 64 КБ, тогда как BTEQ экспортирует по одной строке за раз.

Teradata Parallel Transporter (TPT) – это утилита для загрузки / экспорта данных. Он сочетает в себе все функции FastLoad, MultiLoad, BTEQ, TPUMP и FastExport.

Teradata Parallel Transporter (TPT) – это утилита для загрузки / экспорта данных. Он сочетает в себе все функции FastLoad, MultiLoad, BTEQ, TPUMP и FastExport.

Постоянные журналы отслеживают данные до или после применения изменений. Это поможет откатить или перевернуть стол до определенного состояния. Постоянные журналы могут быть включены на уровне таблицы или базы данных.

Постоянные журналы отслеживают данные до или после применения изменений. Это поможет откатить или перевернуть стол до определенного состояния. Постоянные журналы могут быть включены на уровне таблицы или базы данных.

В Teradata каждый AMP связан с виртуальным диском. Только AMP, которому принадлежит виртуальный диск, может получить доступ к данным на этом виртуальном диске. Это называется «Общая архитектура».

В Teradata каждый AMP связан с виртуальным диском. Только AMP, которому принадлежит виртуальный диск, может получить доступ к данным на этом виртуальном диске. Это называется «Общая архитектура».

  • Если в запросе используются разделенные столбцы, это приведет к исключению разделов, что значительно повысит производительность.

  • Раздел исключает другие разделы и обращается только к разделам, которые содержат данные.

  • Вы можете легко удалить старые разделы и создать новые разделы.

Если в запросе используются разделенные столбцы, это приведет к исключению разделов, что значительно повысит производительность.

Раздел исключает другие разделы и обращается только к разделам, которые содержат данные.

Вы можете легко удалить старые разделы и создать новые разделы.

Да. Вторичный индекс требует вложенных таблиц, которые требуют постоянного пространства.

Да. Вторичный индекс требует вложенных таблиц, которые требуют постоянного пространства.

Да. Каждый раз, когда добавляется многораздельный первичный индекс, каждая строка занимает дополнительные 2 или 8 байтов для номера раздела.

Да. Каждый раз, когда добавляется многораздельный первичный индекс, каждая строка занимает дополнительные 2 или 8 байтов для номера раздела.

Вы можете использовать функцию RANK в указанном столбце в порядке убывания с условием Qualify = 2.

Вы можете использовать функцию RANK в указанном столбце в порядке убывания с условием Qualify = 2.

Вы можете проверить план EXPLAIN запроса, чтобы определить шаги, которые занимают больше места в буфере, и попытаться оптимизировать запрос. Фильтры могут применяться для уменьшения количества обрабатываемых записей, или вы можете разбить большой запрос на несколько меньших запросов.

Вы можете проверить план EXPLAIN запроса, чтобы определить шаги, которые занимают больше места в буфере, и попытаться оптимизировать запрос. Фильтры могут применяться для уменьшения количества обрабатываемых записей, или вы можете разбить большой запрос на несколько меньших запросов.

Когда команда EXPLAIN используется для запроса, она указывает, насколько оптимизатор может извлечь записи.

В Teradata существует три уровня достоверности: высокая достоверность, средняя достоверность и низкая достоверность.

Когда команда EXPLAIN используется для запроса, она указывает, насколько оптимизатор может извлечь записи.

В Teradata существует три уровня достоверности: высокая достоверность, средняя достоверность и низкая достоверность.

И NUSI, и полное сканирование таблицы (FTS) получат доступ ко всем AMP, но FTS получит доступ ко всем блокам в AMP, в то время как NUSI получит доступ к блокам только в том случае, если подстоль содержит соответствующие строки.

И NUSI, и полное сканирование таблицы (FTS) получат доступ ко всем AMP, но FTS получит доступ ко всем блокам в AMP, в то время как NUSI получит доступ к блокам только в том случае, если подстоль содержит соответствующие строки.

В режиме BTEQ команда SKIP может использоваться для пропуска записей.

В режиме BTEQ команда SKIP может использоваться для пропуска записей.

BYTEINT. Он занимает только один байт и может хранить значения до +127.

BYTEINT. Он занимает только один байт и может хранить значения до +127.

  • Через уникальный первичный индекс – 1 AMP
  • Через неуникальный первичный индекс – 1 AMP
  • Через уникальный вторичный индекс – 2 AMP
  • Через неуникальный вторичный индекс – все AMP

Clique – это защитный механизм для обработки сбоев Node. Это группа узлов. В случае сбоя узла в клике vprocs (Parsing Engine и AMP) мигрирует на другие узлы и продолжит выполнять операции чтения / записи на своих виртуальных дисках.

Clique – это защитный механизм для обработки сбоев Node. Это группа узлов. В случае сбоя узла в клике vprocs (Parsing Engine и AMP) мигрирует на другие узлы и продолжит выполнять операции чтения / записи на своих виртуальных дисках.

Teradata обеспечивает разные уровни защиты механизма.

  • Transient Journal – для обработки ошибок транзакции.

  • Отступление – для обработки ошибки AMP.

  • Клик – для обработки отказа узла.

  • RAID – для обработки сбоя диска.

  • Горячий резервный узел – для обработки сбоя узла без ущерба для производительности и перезапуска.

Teradata обеспечивает разные уровни защиты механизма.

Transient Journal – для обработки ошибок транзакции.

Отступление – для обработки ошибки AMP.

Клик – для обработки отказа узла.

RAID – для обработки сбоя диска.

Горячий резервный узел – для обработки сбоя узла без ущерба для производительности и перезапуска.

ACTIVITYCOUNT дает количество строк, затронутых предыдущим запросом SQL в BTEQ. Если оператор ACTIVITYCOUNT следует за оператором вставки, он возвращает количество вставленных строк. Если оператор ACTIVITYCOUNT следует за оператором select, он возвращает количество выбранных строк.

ACTIVITYCOUNT дает количество строк, затронутых предыдущим запросом SQL в BTEQ. Если оператор ACTIVITYCOUNT следует за оператором вставки, он возвращает количество вставленных строк. Если оператор ACTIVITYCOUNT следует за оператором select, он возвращает количество выбранных строк.

Что дальше?

Кроме того, вы можете выполнить свои прошлые задания, которые вы выполнили по предмету, и убедиться, что вы можете говорить с ними уверенно. Если вы свежее, тогда интервьюер не ожидает, что вы ответите на очень сложные вопросы, скорее вы должны сделать свои базовые концепции очень сильными.

Во-вторых, это не имеет большого значения, если вы не можете ответить на несколько вопросов, но важно, чтобы вы ответили с уверенностью. Так что будьте уверены во время интервью. Мы в tutorialspoint желаем вам удачи в выборе хорошего интервьюера и всего самого наилучшего для вашей будущей работы. Ура 🙂