Еще одна область исследований в области ИИ, нейронные сети, основана на естественной нейронной сети нервной системы человека.
Что такое искусственные нейронные сети (ANN)?
Изобретатель первого нейрокомпьютера, доктор Роберт Хехт-Нильсен, определяет нейронную сеть как —
«… вычислительная система, состоящая из ряда простых, сильно взаимосвязанных элементов обработки, которые обрабатывают информацию, реагируя на динамическое состояние на внешние входы».
Основная структура ИНС
Идея ANN основана на убеждении, что работа человеческого мозга путем установления правильных связей может быть имитирована с использованием кремния и проводов в качестве живых нейронов и дендритов .
Человеческий мозг состоит из 86 миллиардов нервных клеток, называемых нейронами. Они связаны с другими тысячами клеток аксонами. Стимулы от внешней среды или сигналы от органов чувств принимаются дендритами. Эти входы создают электрические импульсы, которые быстро проходят через нейронную сеть. Затем нейрон может отправить сообщение другому нейрону для решения проблемы или не отправляет его вперед.
ИНС состоят из множества узлов , которые имитируют биологические нейроны человеческого мозга. Нейроны связаны между собой связями и взаимодействуют друг с другом. Узлы могут принимать входные данные и выполнять простые операции с данными. Результат этих операций передается другим нейронам. Выход на каждом узле называется его активацией или значением узла.
Каждая ссылка связана с весом. ИНС способны к обучению, что происходит путем изменения значений веса. На следующем рисунке показан простой ANN —
Типы искусственных нейронных сетей
Существует две топологии искусственной нейронной сети — FeedForward и Feedback.
FeedForward ANN
В этом ANN поток информации является однонаправленным. Блок отправляет информацию другому блоку, от которого он не получает никакой информации. Там нет петли обратной связи. Они используются при генерации / распознавании / классификации паттернов. Они имеют фиксированные входы и выходы.
Обратная связь
Здесь петли обратной связи разрешены. Они используются в адресно-ориентированной памяти.
Работа ИНС
На показанных диаграммах топологии каждая стрелка представляет связь между двумя нейронами и указывает путь для потока информации. Каждое соединение имеет вес, целое число, которое контролирует сигнал между двумя нейронами.
Если сеть генерирует «хороший или желаемый» выходной сигнал, нет необходимости регулировать весовые коэффициенты. Однако если сеть генерирует «плохой или нежелательный» вывод или ошибку, то система изменяет весовые коэффициенты, чтобы улучшить последующие результаты.
Машинное обучение в ИНС
ИНС способны к обучению, и их необходимо обучать. Есть несколько стратегий обучения —
-
Контролируемое обучение — в нем участвует учитель, который является ученым, чем сама АНН. Например, учитель передает некоторые примеры данных, на которые учитель уже знает ответы.
Например, распознавание образов. ANN придумывает догадки, признавая. Затем учитель предоставляет ИНС ответы. Затем сеть сравнивает свои догадки с «правильными» ответами учителя и вносит коррективы в соответствии с ошибками.
-
Необучаемое обучение — требуется, когда нет примеров данных с известными ответами. Например, поиск скрытого шаблона. В этом случае кластеризация, то есть разделение набора элементов на группы согласно некоторому неизвестному шаблону, выполняется на основе существующих существующих наборов данных.
-
Укрепление обучения — эта стратегия основана на наблюдении. ANN принимает решение, наблюдая за окружающей средой. Если наблюдение отрицательное, сеть корректирует свои веса, чтобы иметь возможность принять другое необходимое решение в следующий раз.
Контролируемое обучение — в нем участвует учитель, который является ученым, чем сама АНН. Например, учитель передает некоторые примеры данных, на которые учитель уже знает ответы.
Например, распознавание образов. ANN придумывает догадки, признавая. Затем учитель предоставляет ИНС ответы. Затем сеть сравнивает свои догадки с «правильными» ответами учителя и вносит коррективы в соответствии с ошибками.
Необучаемое обучение — требуется, когда нет примеров данных с известными ответами. Например, поиск скрытого шаблона. В этом случае кластеризация, то есть разделение набора элементов на группы согласно некоторому неизвестному шаблону, выполняется на основе существующих существующих наборов данных.
Укрепление обучения — эта стратегия основана на наблюдении. ANN принимает решение, наблюдая за окружающей средой. Если наблюдение отрицательное, сеть корректирует свои веса, чтобы иметь возможность принять другое необходимое решение в следующий раз.
Алгоритм обратного распространения
Это алгоритм обучения или обучения. Это учится на примере. Если вы передадите алгоритму пример того, что вы хотите, чтобы сеть делала, он изменит вес сети, чтобы он мог произвести желаемый результат для конкретного ввода по окончании обучения.
Сети обратного распространения идеально подходят для простых задач распознавания образов и картирования.
Байесовские сети (BN)
Это графические структуры, используемые для представления вероятностных отношений между набором случайных величин. Байесовские сети также называют сетями убеждений или байесовскими сетями. БН рассуждает о неопределенной области.
В этих сетях каждый узел представляет собой случайную величину с конкретными предложениями. Например, в области медицинской диагностики узел Рак представляет собой предположение, что у пациента рак.
Ребра, соединяющие узлы, представляют вероятностные зависимости между этими случайными переменными. Если из двух узлов один влияет на другой, то они должны быть напрямую связаны в направлении эффекта. Сила взаимосвязи между переменными количественно определяется вероятностью, связанной с каждым узлом.
Существует только одно ограничение на дуги в BN, которое нельзя вернуть на узел, просто следуя направленным дугам. Следовательно, BN называются направленными ациклическими графами (DAG).
BN способны обрабатывать многозначные переменные одновременно. Переменные BN состоят из двух измерений:
- Диапазон предлогов
- Вероятность назначается каждому из предлогов.
Рассмотрим конечное множество X = {X 1 , X 2 ,…, X n } дискретных случайных величин, где каждая переменная X i может принимать значения из конечного множества, обозначаемого Val (X i ). Если существует направленная связь от переменной X i к переменной X j , то переменная X i будет родительской для переменной X j, показывая прямые зависимости между переменными.
Структура BN идеально подходит для объединения предварительных знаний и данных наблюдений. BN можно использовать для изучения причинно-следственных связей и понимания различных проблемных областей, а также для прогнозирования будущих событий, даже в случае отсутствия данных.
Построение байесовской сети
Инженер по знаниям может построить байесовскую сеть. Есть несколько шагов, которые инженер по знаниям должен предпринять при его создании.
Пример проблемы — рак легких. Пациент страдает от одышки. Он посещает врача, подозревая, что у него рак легких. Врач знает, что, за исключением рака легких, у пациента могут быть и другие заболевания, такие как туберкулез и бронхит.
Соберите соответствующую информацию о проблеме
- Является ли пациент курильщиком? Если да, то высоки шансы на рак и бронхит.
- Подвержен ли пациент загрязнению воздуха? Если да, то какого рода загрязнение воздуха?
- Рентген, положительный рентген, может указывать на туберкулез или рак легких.
Определите интересные переменные
Инженер знаний пытается ответить на вопросы —
- Какие узлы представлять?
- Какие ценности они могут принять? В каком состоянии они могут быть?
А пока давайте рассмотрим узлы, имеющие только дискретные значения. Переменная должна принимать ровно одно из этих значений одновременно.
Общие типы дискретных узлов:
-
Булевы узлы — они представляют предложения, принимая двоичные значения TRUE (T) и FALSE (F).
-
Упорядоченные значения — узел Загрязнение может представлять и принимать значения от {низкий, средний, высокий}, описывающие степень подверженности пациента загрязнению.
-
Интегральные значения — узел с именем Age может представлять возраст пациента с возможными значениями от 1 до 120. Даже на этом раннем этапе делаются выборы моделирования.
Булевы узлы — они представляют предложения, принимая двоичные значения TRUE (T) и FALSE (F).
Упорядоченные значения — узел Загрязнение может представлять и принимать значения от {низкий, средний, высокий}, описывающие степень подверженности пациента загрязнению.
Интегральные значения — узел с именем Age может представлять возраст пациента с возможными значениями от 1 до 120. Даже на этом раннем этапе делаются выборы моделирования.
Возможные узлы и значения для примера рака легких —
Имя узла | Тип | Значение | Создание узлов |
---|---|---|---|
Polution | двоичный | {НИЗКИЙ, ВЫСОКИЙ, СРЕДНИЙ} | |
курильщик | логический | {TRUE, FASLE} | |
Рак легких | логический | {TRUE, FASLE} | |
Рентгеновский | двоичный | {Позитивный негативный} |
Создать дуги между узлами
Топология сети должна фиксировать качественные отношения между переменными.
Например, что вызывает у пациента рак легких? — Загрязнение и курение. Затем добавьте дуги из узла загрязнения и узла курильщика в узел рака легких.
Точно так же, если у пациента рак легких, результат рентгенографии будет положительным. Затем добавьте дуги из узла Lung-Cancer в узел X-Ray.
Укажите топологию
Традиционно BN расположены так, что дуги указывают сверху вниз. Набор родительских узлов узла X задается Parents (X).
У узла Lung-Cancer есть два родителя (причины или причины): загрязнение и Smoker , в то время как узел Smoker является предком узла X-Ray . Точно так же X-Ray является дочерним (следствием или эффектом) узла Lung-Cancer и преемником узлов Smoker и Pollution.
Условные вероятности
Теперь количественно определите отношения между связанными узлами: это делается путем указания условного распределения вероятностей для каждого узла. Так как здесь рассматриваются только дискретные переменные, это принимает форму таблицы условной вероятности (CPT).
Во-первых, для каждого узла нам нужно рассмотреть все возможные комбинации значений этих родительских узлов. Каждая такая комбинация называется созданием родительского набора. Для каждого отдельного создания значений родительского узла нам нужно указать вероятность, которую примет дочерний элемент.
Например, родители узла Рак легких — это загрязнение и курение. Они принимают возможные значения = {(H, T), (H, F), (L, T), (L, F)}. CPT определяет вероятность рака для каждого из этих случаев как <0,05, 0,02, 0,03, 0,001> соответственно.
Каждый узел будет иметь условную вероятность, связанную следующим образом:
Приложения нейронных сетей
Они могут выполнять задачи, которые легки для человека, но трудны для машины —
Авиация и космонавтика — самолеты автопилота, обнаружение неисправностей самолетов.
Автомобили — Автомобильные системы наведения.
Военные — ориентация и управление оружием, отслеживание целей, распознавание объектов, распознавание лиц, идентификация сигнала / изображения.
Электроника — предсказание кодовой последовательности, расположение микросхемы, анализ неисправности микросхемы, машинное зрение, синтез голоса.
Финансовый — Оценка недвижимости, кредитный консультант, проверка ипотеки, рейтинг корпоративных облигаций, программа торговли портфелями, анализ корпоративного финансового состояния, прогноз стоимости валюты, считыватели документов, оценщики кредитных заявок.
Промышленность — управление производственными процессами, проектирование и анализ продукции, системы контроля качества, анализ качества сварки, прогноз качества бумаги, анализ конструкции химической продукции, динамическое моделирование систем химических процессов, анализ технического обслуживания оборудования, определение тендера, планирование и управление проектом.
Медицина — анализ раковых клеток, анализ ЭЭГ и ЭКГ, дизайн протеза, оптимизатор времени трансплантации.
Речь — Распознавание речи, классификация речи, преобразование текста в речь.
Телекоммуникации — Сжатие изображений и данных, автоматизированные информационные услуги, перевод разговорной речи в режиме реального времени.
Транспортировка — Грузовик Диагностика тормозной системы, планирование транспортных средств, системы маршрутизации.
Программное обеспечение — распознавание образов в распознавании лиц, оптическое распознавание символов и т. Д.
Прогнозирование временных рядов — ИНС используются для прогнозирования запасов и стихийных бедствий.
Обработка сигнала — Нейронные сети могут быть обучены обрабатывать звуковой сигнал и соответствующим образом фильтровать его в слуховых аппаратах.
Контроль — ИНС часто используются для принятия решений по управлению физическими транспортными средствами.
Обнаружение аномалий. Поскольку ANN являются экспертами в распознавании шаблонов, их также можно обучить генерировать выходные данные, когда происходит что-то необычное, что не соответствует шаблону.