Teradata - Вопросы и ответы

Уважаемые читатели, эти вопросы для интервью Teradata были разработаны специально для того, чтобы познакомить вас с характером вопросов, с которыми вы можете столкнуться во время интервью по предмету Teradata . Согласно моему опыту, хорошие интервьюеры вряд ли планируют задавать какой-либо конкретный вопрос во время вашего интервью, обычно вопросы начинаются с некоторой базовой концепции предмета, а затем продолжаются на основе дальнейшего обсуждения и того, что вы ответите —

Объясните архитектуру Терадата.

Архитектура Teradata состоит из трех компонентов.

Механизм синтаксического анализа — Механизм синтаксического анализа получает запрос от пользователя, анализирует его и подготавливает план выполнения.
BYNET — BYNET получает план выполнения от механизма синтаксического анализа и отправляет его в соответствующий AMP.
AMP — AMP отвечает за хранение и извлечение строк. Он хранит данные на виртуальном диске, связанном с ним. В дополнение к этому AMP отвечает за управление блокировками, управление пространством, сортировку и агрегацию.

Архитектура Teradata состоит из трех компонентов.

Механизм синтаксического анализа — Механизм синтаксического анализа получает запрос от пользователя, анализирует его и подготавливает план выполнения.

BYNET — BYNET получает план выполнения от механизма синтаксического анализа и отправляет его в соответствующий AMP.

AMP — AMP отвечает за хранение и извлечение строк. Он хранит данные на виртуальном диске, связанном с ним. В дополнение к этому AMP отвечает за управление блокировками, управление пространством, сортировку и агрегацию.

В чем разница между FastLoad и MultiLoad?

FastLoad	Multiload
Целевая таблица должна быть пустой	Целевая таблица не должна быть пустой
Только одна таблица может быть загружена с помощью одного скрипта	Может загружать / обновлять до 5 таблиц
Поддерживает только оператор CREATE / INSERT	Поддерживает до 20 операторов DML в одном скрипте
Не поддерживает таблицы с RI, SI и триггерами	Поддерживает таблицы с NUSI

Почему FastLoad не может загрузить дубликаты записей?

FastLoad обеспечивает возможность перезапуска через контрольные точки. Когда сценарий перезапускается с последней контрольной точки, возможно, что те же строки могут быть снова отправлены в AMP. Вот почему FastLoad не поддерживает дубликаты.

В чем разница между таблицами SET и MULTISET?

Таблица SET не позволяет дублировать записи, тогда как MULTISET допускает дублирование записей.

Как таблица SET проверяет наличие дублирующихся записей?

Для каждой вставленной строки система проверяет, существует ли запись с таким же хешем строки. Если для таблицы определен UPI, она отклонит запись как дубликат. В противном случае он будет сравнивать всю запись на наличие дубликатов. Это серьезно повлияет на производительность системы.

Каков эффективный способ избежать проверки дубликатов строк для таблиц SET?

Вы можете определить уникальный первичный индекс или уникальный вторичный индекс, чтобы избежать дублирования проверки строк.

Каковы разные способы создания таблиц?

Таблицы создаются с помощью оператора CREATE TABLE. Таблицы могут быть созданы с помощью

CREATE TABLE оператор с определением столбца.
СОЗДАТЬ СТОЛ из существующей таблицы.
CREATE TABLE оператор с оператором SELECT.

Таблицы создаются с помощью оператора CREATE TABLE. Таблицы могут быть созданы с помощью

CREATE TABLE оператор с определением столбца.

СОЗДАТЬ СТОЛ из существующей таблицы.

CREATE TABLE оператор с оператором SELECT.

Как вы находите дубликаты записей в таблице?

Повторяющиеся записи могут быть идентифицированы с помощью оператора DISTINCT или оператора GROUP BY.

SELECT DISTINCT column 1, column 2… 
FROM tablename;
  
OR
  
SELECT column 1, column 2,… 
FROM tablename 
GROUP BY column 1, column 2….;

Повторяющиеся записи могут быть идентифицированы с помощью оператора DISTINCT или оператора GROUP BY.

В чем разница между первичным индексом и первичным ключом?

Первичные ключи не являются обязательными в Teradata, тогда как первичный индекс является обязательным.
Распределение данных основано на значении первичного индекса.
Первичные ключи не принимают значения NULL, тогда как первичный индекс принимает значения NULL.
Первичные ключи являются уникальными, тогда как первичный индекс может быть уникальным (UPI) или неуникальным (NUPI).
Первичные ключи не меняются, тогда как первичные индексы меняются.

Первичные ключи не являются обязательными в Teradata, тогда как первичный индекс является обязательным.

Распределение данных основано на значении первичного индекса.

Первичные ключи не принимают значения NULL, тогда как первичный индекс принимает значения NULL.

Первичные ключи являются уникальными, тогда как первичный индекс может быть уникальным (UPI) или неуникальным (NUPI).

Первичные ключи не меняются, тогда как первичные индексы меняются.

Каковы различные способы доступа к данным в таблицах Teradata?

Доступ к данным можно получить тремя различными способами:

Через первичный индекс
Через вторичный индекс
Полное сканирование таблицы

Доступ к данным можно получить тремя различными способами:

Как определить количество AMP в системе?

Это можно определить с помощью запроса SELECT HASHAMP () + 1;

Как определить количество строк в каждом AMP для конкретной таблицы?

Следующий запрос может быть использован для этой цели.

SELECT HASHMAP(HASHBUCKET(HASHROW(primaryindexvalue))), COUNT(*) 
FROM tablename GROUP BY 1;

Следующий запрос может быть использован для этой цели.

Какие режимы транзакций доступны в Teradata?

Teradata поддерживает два режима транзакций.

Teradata
ANSI

Режим Teradata устанавливается с помощью SET SESSION TRANSACTION BTET; Режим ANSI устанавливается с помощью SET SESSION TRANSACTION ANSI;

Teradata поддерживает два режима транзакций.

Режим Teradata устанавливается с помощью SET SESSION TRANSACTION BTET; Режим ANSI устанавливается с помощью SET SESSION TRANSACTION ANSI;

Как выполнять транзакции с использованием Teradata?

Транзакции могут быть выполнены с использованием операторов BT и ET.

Как получить доступ к данным, хранящимся в индексах соединения?

Присоединение к индексам не может быть доступно непосредственно пользователю. Только оптимизатор может получить к ним доступ.

Что произойдет, если входной файл для скрипта FastLoad содержит дубликаты записей?

Дублированные записи будут отклонены от загрузки целевых таблиц и будут вставлены в таблицу UV.

Какая польза от FALLBACK?

FALLBACK — это механизм защиты, используемый Teradata для обработки сбоев AMP. Для каждой строки данных другая копия строки хранится в другом AMP в кластере. В случае сбоя любого AMP соответствующие строки будут доступны с помощью FALLBACK AMP.

Как указать опцию FALLBACK для таблицы?

FALLBACK может быть упомянут при создании таблицы с помощью оператора CREATE TABLE или после создания таблицы с помощью инструкции ALTER TABLE.

Когда вы получите ошибку Spool Space?

Ошибка пространства в буфере произойдет, если промежуточные результаты запроса превысят ограничение на размер буфера в AMP, установленное для пользователя, отправившего запрос.

Какая польза от команды SLEEP?

Команда SLEEP указывает время ожидания перед попыткой Teradata установить соединение.

Какая польза от команды TENACITY?

Команда TENACITY указывает общее время ожидания Teradata для установления нового соединения.

Как снять блокировку таблицы после сбоя FASTLOAD?

Вы можете просто сохранить операторы BEGIN LOADING и END LOADING и отправить скрипт FASTLOAD. Другой вариант — удалить таблицу и снова создать таблицу.

Какая польза от кеширования в Teradata?

Кэширование в Teradata работает с источником и остается в том же порядке, то есть не часто меняется. Кэш обычно распределяется между приложениями. Это дополнительное преимущество использования Teradata.

Что такое RAID?

RAID — это защитный механизм для обработки сбоя диска. Он обозначает избыточный массив независимых дисков. RAID 1 обычно используется в Teradata.

Каковы преимущества и недостатки вторичного индекса?

Вторичный индекс предоставляет альтернативный путь для доступа к данным. Они используются, чтобы избежать полного сканирования таблицы. Однако вторичные индексы требуют дополнительной физической структуры для поддержки вложенных таблиц, а также требуют дополнительного ввода-вывода, так как вложенная таблица должна быть обновлена для каждой строки.

Какие типы блокировки доступны в Teradata?

В Teradata есть четыре разных замка: эксклюзивный, запись, чтение и доступ.

Какие уровни блокировки доступны в Teradata?

Блокировки могут применяться на трех разных уровнях — База данных, Таблица и Строка.

Сколько значений можно сжать в таблице?

Используя многозначное сжатие (MVC), вы можете сжать до 255 значений, включая NULL.

Как FastLoad загружает данные в Teradata?

FastLoad загружает данные в блоках по 64 КБ. В FastLoad есть 2 этапа.

На этапе 1 он переносит данные в блоки по 64 КБ и отправляет их целевым AMP. Затем каждый AMP будет перераспределять строки по своим целевым AMP.
На этапе 2 строки сортируются по порядку их хеширования и записываются в целевую таблицу.

FastLoad загружает данные в блоках по 64 КБ. В FastLoad есть 2 этапа.

На этапе 1 он переносит данные в блоки по 64 КБ и отправляет их целевым AMP. Затем каждый AMP будет перераспределять строки по своим целевым AMP.

На этапе 2 строки сортируются по порядку их хеширования и записываются в целевую таблицу.

Каковы все различные фазы MultiLoad?

Импорт MultiLoad имеет пять этапов.

Этап 1 — Предварительный этап — выполняет основные действия по настройке.
Этап 2 — этап транзакции DML — проверяет синтаксис операторов DML и переносит их в систему Teradata.
Этап 3 — Этап сбора данных — переносит входные данные в рабочие таблицы и блокирует таблицу.
Этап 4 — Этап применения — Применяет все операции DML.
Фаза 5 — Фаза очистки — Снимает блокировку стола.

Импорт MultiLoad имеет пять этапов.

Этап 1 — Предварительный этап — выполняет основные действия по настройке.

Этап 2 — этап транзакции DML — проверяет синтаксис операторов DML и переносит их в систему Teradata.

Этап 3 — Этап сбора данных — переносит входные данные в рабочие таблицы и блокирует таблицу.

Этап 4 — Этап применения — Применяет все операции DML.

Фаза 5 — Фаза очистки — Снимает блокировку стола.

Какой более быстрый способ удалить данные из таблиц? УДАЛИТЬ ИЗ оператора или MultiLoad УДАЛИТЬ

MULTILOAD DELETE быстрее, так как удаляет записи в блоках. DELETE FROM удалит строку за строкой.

В чем разница между хранимой процедурой и макросом?

Хранимая процедура возвращает одно или несколько значений, тогда как макросы могут возвращать одну или несколько строк. В дополнение к SQL хранимая процедура может содержать операторы SPL.

Какой лучший способ загрузить данные в Teradata? FastLoad / BTEQ / Multiload?

И FastLoad, и MultiLoad загружают данные в блоках по 64 КБ, тогда как BTEQ будет обрабатывать по одной строке за раз.

Какой лучший способ извлечь данные из Teradata? BTEQ / FastExport?

FastExport экспортирует данные в блоках по 64 КБ, тогда как BTEQ экспортирует по одной строке за раз.

Что такое ТПТ?

Teradata Parallel Transporter (TPT) — это утилита для загрузки / экспорта данных. Он сочетает в себе все функции FastLoad, MultiLoad, BTEQ, TPUMP и FastExport.

Что такое постоянный журнал в Teradata?

Постоянные журналы отслеживают данные до или после применения изменений. Это поможет откатить или перевернуть стол до определенного состояния. Постоянные журналы могут быть включены на уровне таблицы или базы данных.

Почему архитектура Teradata называется архитектурой Shared Nothing?

В Teradata каждый AMP связан с виртуальным диском. Только AMP, которому принадлежит виртуальный диск, может получить доступ к данным на этом виртуальном диске. Это называется «Общая архитектура».

В чем преимущество первичного индекса раздела?

Если в запросе используются разделенные столбцы, это приведет к исключению разделов, что значительно повысит производительность.
Раздел исключает другие разделы и обращается только к разделам, которые содержат данные.
Вы можете легко удалить старые разделы и создать новые разделы.

Если в запросе используются разделенные столбцы, это приведет к исключению разделов, что значительно повысит производительность.

Раздел исключает другие разделы и обращается только к разделам, которые содержат данные.

Вы можете легко удалить старые разделы и создать новые разделы.

Если в таблице создается вторичный индекс, увеличится ли размер таблицы? Зачем?

Да. Вторичный индекс требует вложенных таблиц, которые требуют постоянного пространства.

Если в таблицу будет добавлен многораздельный первичный индекс, увеличится ли размер таблицы? Зачем?

Да. Каждый раз, когда добавляется многораздельный первичный индекс, каждая строка занимает дополнительные 2 или 8 байтов для номера раздела.

Как вы определяете ^{второе по} величине значение из таблицы?

Вы можете использовать функцию RANK в указанном столбце в порядке убывания с условием Qualify = 2.

Как вы справляетесь с ошибкой места в буфере?

Вы можете проверить план EXPLAIN запроса, чтобы определить шаги, которые занимают больше места в буфере, и попытаться оптимизировать запрос. Фильтры могут применяться для уменьшения количества обрабатываемых записей, или вы можете разбить большой запрос на несколько меньших запросов.

Каковы уровни доверия в Teradata?

Когда команда EXPLAIN используется для запроса, она указывает, насколько оптимизатор может извлечь записи.

В Teradata существует три уровня достоверности: высокая достоверность, средняя достоверность и низкая достоверность.

Когда команда EXPLAIN используется для запроса, она указывает, насколько оптимизатор может извлечь записи.

В чем разница между NUSI и полным сканированием таблицы?

И NUSI, и полное сканирование таблицы (FTS) получат доступ ко всем AMP, но FTS получит доступ ко всем блокам в AMP, в то время как NUSI получит доступ к блокам только в том случае, если подстоль содержит соответствующие строки.

Как пропустить первые несколько записей из входного файла при загрузке в Teradata?

В режиме BTEQ команда SKIP может использоваться для пропуска записей.

Какой тип данных лучше подходит для хранения информации о возрасте?

BYTEINT. Он занимает только один байт и может хранить значения до +127.

Укажите количество AMP, к которым обращается каждый метод.

Через уникальный первичный индекс — 1 AMP
Через неуникальный первичный индекс — 1 AMP
Через уникальный вторичный индекс — 2 AMP
Через неуникальный вторичный индекс — все AMP

Что такое клика?

Clique — это защитный механизм для обработки сбоев Node. Это группа узлов. В случае сбоя узла в клике vprocs (Parsing Engine и AMP) мигрирует на другие узлы и продолжит выполнять операции чтения / записи на своих виртуальных дисках.

Какие механизмы защиты доступны в Teradata?

Teradata обеспечивает разные уровни защиты механизма.

Transient Journal — для обработки ошибок транзакции.
Отступление — для обработки ошибки AMP.
Клик — для обработки отказа узла.
RAID — для обработки сбоя диска.
Горячий резервный узел — для обработки сбоя узла без ущерба для производительности и перезапуска.

Teradata обеспечивает разные уровни защиты механизма.

Transient Journal — для обработки ошибок транзакции.

Отступление — для обработки ошибки AMP.

Клик — для обработки отказа узла.

RAID — для обработки сбоя диска.

Горячий резервный узел — для обработки сбоя узла без ущерба для производительности и перезапуска.

Какая польза от ACTIVITYCOUNT?

ACTIVITYCOUNT дает количество строк, затронутых предыдущим запросом SQL в BTEQ. Если оператор ACTIVITYCOUNT следует за оператором вставки, он возвращает количество вставленных строк. Если оператор ACTIVITYCOUNT следует за оператором select, он возвращает количество выбранных строк.

Что дальше?

Кроме того, вы можете выполнить свои прошлые задания, которые вы выполнили по предмету, и убедиться, что вы можете говорить с ними уверенно. Если вы свежее, тогда интервьюер не ожидает, что вы ответите на очень сложные вопросы, скорее вы должны сделать свои базовые концепции очень сильными.

Во-вторых, это не имеет большого значения, если вы не можете ответить на несколько вопросов, но важно, чтобы вы ответили с уверенностью. Так что будьте уверены во время интервью. Мы в tutorialspoint желаем вам удачи в выборе хорошего интервьюера и всего самого наилучшего для вашей будущей работы. Ура 🙂

Teradata — Вопросы и ответы

Что дальше?

Популярные уроки и статьи

Инициализаторы экземпляра в Java объяснены

AJAX - Краткое руководство

TempDB для производительности