Учебники

15) Интервью машинного обучения Q & A

Скачать PDF

1) Что такое машинное обучение?

Машинное обучение — это отрасль информатики, которая занимается системным программированием, чтобы автоматически учиться и совершенствоваться с опытом. Например: роботы запрограммированы так, чтобы они могли выполнять задачу на основе данных, которые они собирают с датчиков. Он автоматически изучает программы на основе данных.

2) Укажите разницу между Data Mining и Машинным обучением?

Машинное обучение связано с изучением, проектированием и разработкой алгоритмов, которые дают компьютерам возможность учиться без явного программирования. В то время как интеллектуальный анализ данных может быть определен как процесс, в котором неструктурированные данные пытаются извлечь знания или неизвестные интересные шаблоны. Во время этого процесса используются обучающие алгоритмы.

3) Что такое «переоснащение» в машинном обучении?

В машинном обучении, когда статистическая модель описывает случайную ошибку или шум вместо базовой зависимости, возникает «переоснащение». Когда модель чрезмерно сложна, обычно наблюдается переобучение из-за слишком большого количества параметров относительно количества типов обучающих данных. Модель демонстрирует низкую производительность, которая была нарядной.

4) Почему происходит переоснащение?

Существует возможность переоснащения, поскольку критерии, используемые для обучения модели, не совпадают с критериями, используемыми для оценки эффективности модели.

5) Как избежать перегрузки?

Используя много данных, можно избежать перенастройки, переоснащение происходит относительно того, что у вас есть небольшой набор данных, и вы пытаетесь извлечь из него уроки. Но если у вас небольшая база данных, и вы вынуждены использовать модель, основанную на этом. В такой ситуации вы можете использовать метод, известный как перекрестная проверка . В этом методе набор данных разделяется на два раздела: наборы данных тестирования и обучения, набор данных тестирования будет проверять только модель, в то время как в обучающем наборе данных точки данных придумают модель.

В этом методе модели обычно присваивается набор данных с известными данными, по которым проводится обучение (набор данных обучения), и набор данных с неизвестными данными, по которым тестируется модель. Идея перекрестной проверки заключается в определении набора данных для «тестирования» модели на этапе обучения.

6) Что такое индуктивное машинное обучение?

Индуктивное машинное обучение включает в себя процесс обучения на примерах, где система из набора наблюдаемых примеров пытается выработать общее правило.

7) Какие пять популярных алгоритмов машинного обучения?

  • Деревья решений
  • Нейронные сети (обратное распространение)
  • Вероятностные сети
  • Ближайший сосед
  • Опорные векторные машины

8) Каковы различные методы алгоритма в машинном обучении?

Различные типы методов в машинном обучении

  • Контролируемое обучение
  • Обучение без учителя
  • Обучение под наблюдением
  • Усиление обучения
  • трансдукция
  • Учиться усваивать знания

9) Каковы три этапа построения гипотезы или модели в машинном обучении?

  • Построение модели
  • Модельное тестирование
  • Применяя модель

10) Каков стандартный подход к обучению под наблюдением?

Стандартный подход к обучению под наблюдением состоит в том, чтобы разбить набор примеров на набор тренировок и тест.

11) Что такое «Набор тренировок» и «Набор тестов»?

В различных областях информатики, таких как машинное обучение, набор данных используется для обнаружения потенциально прогнозирующих отношений, известных как «Учебный набор». Учебный набор — это примеры, данные ученику, в то время как набор Тестов используется для проверки точности гипотез, сгенерированных учеником, и это набор примеров, скрытых от ученика. Учебный набор отличается от тестового набора.

12) Перечислите различные подходы для машинного обучения?

Различные подходы в машинном обучении

  • Концепция против классификации обучения
  • Символическое и статистическое обучение
  • Индуктивное и аналитическое обучение

13) Что не является машинным обучением?

  • Искусственный интеллект
  • Логический вывод

14) Объясните, какова функция «обучения без учителя»?

  • Найти кластеры данных
  • Найти низкоразмерные представления данных
  • Найти интересные направления в данных
  • Интересные координаты и корреляции
  • Найти новые наблюдения / очистка базы данных

15) Объясните, какова функция «контролируемого обучения»?

  • классификации
  • Распознавание речи
  • регрессия
  • Предсказать временные ряды
  • Аннотировать строки

16) Что такое алгоритм независимого машинного обучения?

Машинное обучение, в котором математические основы не зависят от какого-либо конкретного классификатора или алгоритма обучения, называется алгоритмом независимого машинного обучения?

17) В чем разница между искусственным обучением и машинным обучением?

Проектирование и разработка алгоритмов в соответствии с поведением, основанным на эмпирических данных, известны как машинное обучение. Хотя искусственный интеллект в дополнение к машинному обучению, он также охватывает другие аспекты, такие как представление знаний, обработка естественного языка, планирование, робототехника и т. Д.

18) Что такое классификатор в машинном обучении?

Классификатор в машинном обучении — это система, которая вводит вектор дискретных или непрерывных значений признаков и выводит одно дискретное значение, класс.

19) Каковы преимущества наивного Байеса?

В наивном байесовском классификаторе будет сходиться быстрее, чем дискриминационные модели, такие как логистическая регрессия, поэтому вам нужно меньше обучающих данных. Основным преимуществом является то, что он не может изучить взаимодействия между функциями.

20) В каких областях используется Распознавание образов?

Распознавание образов может быть использовано в

  • Компьютерное зрение
  • Распознавание речи
  • Сбор данных
  • Статистика
  • Неформальный поиск
  • Биоинформатики

21) Что такое генетическое программирование?

Генетическое программирование является одним из двух методов, используемых в машинном обучении. Модель основана на тестировании и выборе лучшего из множества результатов.

22) Что такое индуктивное логическое программирование в машинном обучении?

Индуктивное логическое программирование (ILP) — это подполе машинного обучения, в котором используется логическое программирование, представляющее базовые знания и примеры.

23) Что такое выбор модели в машинном обучении?

Процесс выбора моделей среди различных математических моделей, которые используются для описания одного и того же набора данных, известен как Выбор модели. Выбор модели применяется в областях статистики, машинного обучения и интеллектуального анализа данных.

24) Какие два метода используются для калибровки в контролируемом обучении?

Для прогнозирования хороших вероятностей в контролируемом обучении используются два метода:

  • Калибровка Платта
  • Изотоническая регрессия

Эти методы предназначены для бинарной классификации, и это не тривиально.

25) Какой метод часто используется для предотвращения переоснащения?

При наличии достаточных данных «Изотоническая регрессия» используется для предотвращения проблемы переобучения.

26) В чем разница между эвристикой для обучения правилам и эвристикой для деревьев решений?

Различие состоит в том, что эвристика для деревьев решений оценивает среднее качество ряда несвязанных наборов, в то время как изучающие правила оценивают только качество набора экземпляров, охватываемого правилом-кандидатом.

27) Что такое персептрон в машинном обучении?

В машинном обучении Perceptron представляет собой алгоритм для контролируемой классификации входа в один из нескольких возможных недвоичных выходов.

28) Объясните две составляющие байесовской логической программы?

Байесовская логическая программа состоит из двух компонентов. Первый компонент является логичным; он состоит из набора байесовских предложений, который отражает качественную структуру домена. Второй компонент является количественным, он кодирует количественную информацию о домене.

29) Что такое байесовские сети (БН)?

Байесовская сеть используется для представления графической модели вероятностных отношений между множеством переменных.

30) Почему алгоритм обучения на основе экземпляров иногда называют алгоритмом обучения Lazy?

Алгоритм обучения на основе экземпляров также называется ленивым алгоритмом обучения, поскольку он задерживает процесс индукции или обобщения до тех пор, пока не будет выполнена классификация.

31) С какими двумя методами классификации может работать SVM (машина опорных векторов)?

  • Объединение двоичных классификаторов
  • Модификация двоичного кода для включения мультиклассового обучения

32) Что такое ансамблевое обучение?

Чтобы решить конкретную вычислительную программу, стратегически генерируются и объединяются несколько моделей, таких как классификаторы или эксперты. Этот процесс известен как обучение ансамблю.

33) Почему используется ансамблевое обучение?

Обучение ансамблю используется для улучшения классификации, прогнозирования, приближения функций и т. Д. Модели.

34) Когда использовать ансамблевое обучение?

Обучение ансамблю используется при создании классификаторов компонентов, которые являются более точными и независимыми друг от друга.

35) Каковы две парадигмы ансамблевых методов?

Две парадигмы ансамблевых методов

  • Методы последовательного ансамбля
  • Параллельные методы ансамбля

36) Каков общий принцип ансамблевого метода и что такое бэгинг и бустинг в ансамблевом методе?

Общий принцип метода ансамбля состоит в том, чтобы объединить предсказания нескольких моделей, построенных с данным алгоритмом обучения, чтобы улучшить устойчивость по одной модели. Пакетирование — это метод в ансамбле для улучшения нестабильных схем оценки или классификации. При этом метод бустинга используется последовательно для уменьшения смещения комбинированной модели. Повышение и пакетирование могут уменьшить ошибки, уменьшая срок отклонения.

37) Что такое разностная декомпозиция ошибки классификации в методе ансамбля?

Ожидаемая ошибка алгоритма обучения может быть разложена на смещение и дисперсию. Термин смещения показывает, насколько точно средний классификатор, созданный алгоритмом обучения, соответствует целевой функции. Дисперсионный термин показывает, насколько сильно изменяется прогноз алгоритма обучения для разных обучающих наборов.

38) Что такое алгоритм инкрементного обучения в ансамбле?

Метод добавочного обучения — это способность алгоритма извлекать уроки из новых данных, которые могут быть доступны после того, как классификатор уже сгенерирован из уже доступного набора данных.

39) Для чего используются PCA, KPCA и ICA?

PCA (анализ основных компонентов), KPCA (анализ основных компонентов на основе ядра) и ICA (независимый анализ компонентов) — важные методы выделения признаков, используемые для уменьшения размерности.

40) Что такое сокращение размеров в машинном обучении?

В машинном обучении и статистике уменьшение размеров — это процесс сокращения числа случайных величин по соображениям, и его можно разделить на выбор и извлечение признаков.

41) Что такое опорные векторные машины?

Машины опорных векторов представляют собой контролируемые алгоритмы обучения, используемые для классификации и регрессионного анализа.

42) Каковы компоненты методов оценки отношений?

Важными компонентами методов оценки отношений являются

  • Получение данных
  • Земная Истина Приобретение
  • Метод перекрестной проверки
  • Тип запроса
  • Метрика
  • Тест на значимость

43) Какие существуют методы последовательного контролируемого обучения?

Различные методы решения проблем последовательного контролируемого обучения

  • Методы скользящего окна
  • Рекуррентные раздвижные окна
  • Скрытые марковские модели
  • Максимальная энтропия марковских моделей
  • Условные случайные поля
  • График трансформаторных сетей

44) В каких областях робототехники и обработки информации возникает проблема последовательного прогнозирования?

Области робототехники и обработки информации, в которых возникает проблема последовательного прогнозирования:

  • Имитация обучения
  • Структурный прогноз
  • Основанное на модели обучение

45) Что такое пакетное статистическое обучение?

Статистические методы обучения позволяют изучать функцию или предиктор из набора наблюдаемых данных, которые могут делать прогнозы о невидимых или будущих данных. Эти методы обеспечивают гарантии эффективности изученного предиктора в отношении будущих невидимых данных на основе статистического предположения о процессе создания данных.

46) Что такое PAC Learning?

PAC (вероятно, приблизительно правильное) обучение — это система обучения, которая была введена для анализа алгоритмов обучения и их статистической эффективности.

47) Какие категории вы можете классифицировать в процессе обучения последовательности?

  • Прогнозирование последовательности
  • Генерация последовательности
  • Распознавание последовательности
  • Последовательное решение

48) Что такое последовательность обучения?

Последовательное обучение — это метод преподавания и обучения в логической форме.

49) Какие две техники машинного обучения?

Две техники машинного обучения

  • Генетическое программирование
  • Индуктивное обучение

50) Дайте популярное приложение машинного обучения, которое вы видите на повседневной основе?

Механизм рекомендаций, реализованный на крупных веб-сайтах электронной коммерции, использует машинное обучение.