Учебники

38) Teradata Interview Q & A

Скачать PDF

1) Как вы определяете Teradata? Дайте некоторые из основных характеристик того же самого.

Teradata – это в основном RDMS, которая используется для управления Datamart, Datawarehouse, OLAP, OLTP, а также DSS Appliances компании. Некоторые из основных характеристик Teradata приведены ниже.

  • Способен работать как на одиночных, так и на нескольких узлах.
  • Параллелизм встроен в систему.
  • Очень совместим со стандартами ANSI.
  • Склонен действовать так же, как сервер.
  • Это открытая система, которая в основном выполняется для UNIX MR-RAS, Suse Linux ETC, WIN2K и т. Д.

2) Каковы новые функции Teradata?

Некоторые из недавно разработанных функций Teradata: –

  • Автоматизированная временная аналитика
  • Расширение возможностей сжатия, которое позволяет гибкое сжатие данных примерно в 20 раз больше данных, чем в предыдущей версии.
  • Инновации, связанные с клиентами, такие как точка зрения тетрадата

3) Выделите несколько важных компонентов Teradata.

Некоторые из важных компонентов Teradata: –

  • Байнет
  • Модуль доступа к процессору (AMP)
  • Парсинг двигателя (PE)
  • Виртуальный диск (виртуальный диск)
  • Виртуальная система хранения (VSS)

Teradata Интервью Вопросы

4) Упомяните процедуру, с помощью которой мы можем запускать задания Teradata в среде UNIX.

Все, что вам нужно сделать, это выполнить выполнение в UNIX так, как указано ниже.

$ Sh> BTEQ <[Путь к скрипту]> [Путь к лог-файлу]

или

$ Sh> BTEQ <[Путь к скрипту] TEE [Путь к лог-файлу]

5) Как мы генерируем последовательность в Teradata?

В Teradata мы генерируем последовательность, используя столбец идентификации

6) Как во время отображения Teradata генерируется последовательность?

Все, что вам нужно сделать, это использовать CSUM.

7) Определенная нагрузка накладывается на стол и это тоже каждый час. Утром движение относительно низкое, а ночью очень высокое. Согласно этой ситуации, какая утилита является наиболее рекомендуемой и как ее следует загружать?

The most suggestible utility here has to be Tpump. By making use of packet size decreasing or increasing, the traffic can be easily handled.

8) If Fast Load Script fails and only the error tables are made available to you, then how will you restart?

There are basically two ways of restarting in this case.

  • Making the old file to run – Make sure that you do not completely drop the error tables. Instead, try to rectify the errors that are present in the script or the file and then execute again.
  • Running a new file – In this process, the script is executed simply using end loading and beginning statements. This will help in removing the lock that has been put up on the target table and might also remove the given record from the fast-log table. Once this is done, you are free to run the whole script once again.

9) Mention a few of the ETL tools that come under Teradata.

Some of the ETL tools which are commonly used in Teradata are DataStage, Informatica, SSIS, etc.

10) Highlight a few of the advantages that ETL tools have over TD.

Some of the advantages that ETL tools have over TD are: –

  • Multiple heterogeneous destinations, as well as sources can be operated.
  • Debugging process is much easier with the help of ETL tools owing to full-fledged GUI support.
  • Components of ETL tools can be easily reused, and as a result, if there is an update to the main server, then all the corresponding applications connected to the server are updated automatically.
  • De-pivoting and pivoting can be easily done using ETL tools.

11) What is the meaning of Caching in Teradata?

Caching is considered as an added advantage of using Teradata as it primarily works with the source which stays in the same order i.e. does not change on a frequent basis. At times, Cache is usually shared amongst applications.

12) How can we check the version of Teradata that we are using currently?

Just give the command .SHOW VERSION.

13) Give a justifiable reason why Multi-load supports NUSI instead of USI.

The index sub-table row happens to be on the same Amp in the same way as the data row in NUSI. Thus, each Amp is operated separately and in a parallel manner.

14) How is MLOAD Client System restarted after execution?

The script has to be submitted manually so that it can easily load the data from the checkpoint that comes last.

15) How is MLOAD Teradata Server restarted after execution?

The process is basically carried out from the last known checkpoint, and once the data has been carried out after execution of MLOAD script, the server is restarted.

16) What is meant by a node?

A node basically is termed as an assortment of components of hardware and software. Usually a server is referred to as a node.

17) Let us say there is a file that consists of 100 records out of which we need to skip the first and the last 20 records. What will the code snippet?

We need to use BTEQ Utility in order to do this task. Skip 20, as well as Repeat 60 will be used in the script.

18) Explain PDE.

PDE basically stands for Parallel Data Extension. PDE basically happens to be an interface layer of software present above the operation system and gives the database a chance to operate in a parallel milieu.

19) What is TPD?

TPD в основном означает Trusted Parallel Database и работает в основном под PDE. Teradata – это база данных, которая в основном работает под управлением PDE. По этой причине Teradata обычно называют базой данных Trusted Parallel или Pure Parallel.

20) Что подразумевается под драйвером канала?

Драйвер канала – это программное обеспечение, которое выступает в качестве средства связи между PE и всеми приложениями, работающими на каналах, подключенных к клиентам.

21) Что подразумевается под Teradata Gateway?

Как и драйвер канала, Teradata Gateway служит средством связи между Parse Engine и приложениями, которые подключены к сетевым клиентам. На каждый узел назначается только один шлюз.

22) Что подразумевается под виртуальным диском?

Виртуальный диск – это в основном компиляция целого массива цилиндров, которые являются физическими дисками. Иногда его называют дисковым массивом.

23) Объясните значение Amp?

Amp в основном означает Access Module Processor и фактически работает как процессор, и в основном используется для управления одной частью базы данных. Эта конкретная часть базы данных не может использоваться другими Amp. Таким образом, эту форму архитектуры обычно называют архитектурой без общего доступа.

24) Что содержит Amp и какие операции он выполняет?

Amp в основном состоит из подсистемы Database Manager и может выполнять операции, указанные ниже.

  • Выполнение DML
  • Выполнение DDL
  • Реализация агрегатов и объединений.
  • Освобождение и применение замков и т. Д.

25) Что подразумевается под парсинговым движком?

ЧП бывает своего рода Vproc. Его основная функция – принимать запросы SQL и доставлять ответы в SQL. Он состоит из широкого спектра программных компонентов, которые используются для разбиения SQL на различные этапы, а затем отправляют эти этапы в AMP.

26) Что вы подразумеваете под анализом?

Синтаксический анализ – это процесс, связанный с анализом символов строки на компьютерном или естественном языке.

27) Каковы функции парсера?

Парсер: –

  • Проверяет ошибки семантики
  • Проверяет синтаксические ошибки
  • Проверяет наличие объекта

28) Что подразумевается под диспетчером?

Диспетчер принимает целую коллекцию запросов и сохраняет их в очереди. В течение всего процесса сохраняется одна и та же очередь для доставки нескольких наборов ответов.

29) Сколько сеансов MAX способен обрабатывать PE в определенное время?

PE может обрабатывать в общей сложности 120 сеансов в определенный момент времени.

30) Объясните БАЙН.

BYNET в основном служит средством связи между компонентами. Он в первую очередь отвечает за отправку сообщений, а также отвечает за выполнение операций слияния и сортировки.

31) Что подразумевается под кликой?

Клик, как известно, представляет собой набор узлов, которые распределяются между общими дисками. Наличие Clique очень важно, так как помогает избежать сбоев узлов.

32) Что происходит, когда узел подвергается падению?

Всякий раз, когда происходит снижение уровня производительности узла, все соответствующие Vprocs немедленно мигрируют на новый узел с отказавшего узла, чтобы вернуть все данные с общих дисков.

33) Перечислите все формы замков, которые доступны в Teradata.

Есть в основном четыре типа замков, которые подпадают под Teradata. Эти: –

  • Блокировка чтения
  • Блокировка доступа
  • Эксклюзивный замок
  • Блокировка записи

34) Каков конкретно назначенный уровень, на котором LOCK может применяться в Teradata?

  • Уровень таблицы – все строки, которые присутствуют внутри таблицы, обязательно будут заблокированы.
  • Блокировка уровня базы данных – все объекты, которые присутствуют в базе данных, будут заблокированы.
  • Блокировка уровня хэша строки – блокируются только те строки, которые соответствуют конкретной строке.

35) В первичном индексе, какова оценка AMP, которые активно участвуют?

Только один AMP активно участвует в первичном индексе.

36) Какое значение имеет команда UPSERT в Teradata?

UPSERT в основном выступает за обновление вставки. Эта опция доступна только в Teradata.

37) Выделите преимущества PPI (первичного индекса раздела).

PPI в основном используется для хранения данных на основе диапазона или категории. Когда дело доходит до запросов Range, нет необходимости использовать полное сканирование таблицы, поскольку оно сразу перемещается в следующий раздел, пропуская все остальные разделы.

38) Дайте размеры SMALLINT, BYTEINT и INTEGER.

SMALLINT – 2 байта – 16 укусов -> -32768 до 32767

BYTEINT – 1 байт – 8 бит -> -128 до 127

INTEGER – 4 байта – 32 бита -> -2 147 483 648 до 2 147 483 647

39) Что подразумевается под Планом наименьшей стоимости?

План наименьших затрат в основном выполняется за меньшее время по кратчайшему пути.

40) Выделите точки различия между базой данных и пользователем в Teradata.

  • База данных в основном пассивна, тогда как пользователь активен.
  • База данных в первую очередь хранит все объекты базы данных, тогда как пользователь может хранить любой объект, будь то макрос, таблица, представление и т. Д.
  • База данных не имеет пароля, в то время как пользователь должен ввести пароль.

41) Выделите различия между первичным ключом и первичным индексом.

  • Первичный индекс является обязательным, тогда как первичный ключ является необязательным.
  • Первичный индекс имеет ограничение в 64 таблицы / столбца, тогда как первичный ключ не имеет никакого ограничения.
  • Первичный индекс допускает дубликаты и пустые значения, а первичный ключ – нет.
  • Первичный индекс – это физический механизм, тогда как первичный ключ – это чисто логический механизм.

42) Объясните, как используется пространство катушки.

Буферное пространство в Teradata в основном используется для выполнения запросов. Из общего пространства, доступного в Teradata, 20% пространства в основном отведено для спулинга.

43) Подчеркните необходимость настройки производительности.

Настройка производительности в Teradata в основном делается для выявления всех узких мест, а затем их устранения.

44) Прокомментируйте, является ли узкое место ошибкой или нет.

Технически узкое место не является формой ошибки, но, безусловно, вызывает определенную задержку в системе.

45) Как можно определить узкие места?

Есть в основном четыре способа определения узкого места. Эти: –

  • Teradata Visual Объяснить
  • Объяснить запрос модификатор
  • Менеджер Teradata
  • Монитор производительности

46) Что подразумевается под самым дорогим планом?

В соответствии с Планом с наивысшими затратами время, затрачиваемое на выполнение процесса, больше, и для него требуется самый длинный доступный путь.

47) Выделите все режимы, представленные в разделе «Уровень достоверности».

Низкий, Нет, Высокий и Присоединение – это четыре режима, которые присутствуют в разделе «Уровень доверия».

48) Назовите пять фаз, которые входят в MultiLoad Utility.

Предварительная фаза, фаза DML, фаза сбора данных, фаза приложения и конечная фаза.

49) Выделите ограничения утилиты TPUMP.

Ниже приведены ограничения утилиты TPUMP:

  • Мы не можем использовать оператор SELECT.
  • Файлы данных не могут быть объединены.
  • Агрегатные и экспоненциальные операторы не поддерживаются.
  • Арифметические функции не поддерживаются.

50) Как устанавливаются параметры сеансового режима в BTEQ?

.set сеанс транзакций BTET -> режим транзакций Teradata

.set сеанс транзакций ANSI -> режим ANSI

Эти команды будут работать только тогда, когда они введены до входа в сеанс.