Учебники

Биопайтон — Машинное обучение

Биоинформатика — отличная область для применения алгоритмов машинного обучения. Здесь мы имеем генетическую информацию о большом количестве организмов, и невозможно вручную проанализировать всю эту информацию. Если используется правильный алгоритм машинного обучения, мы можем извлечь много полезной информации из этих данных. Biopython предоставляет полезный набор алгоритмов для контролируемого машинного обучения.

Контролируемое обучение основано на входной переменной (X) и выходной переменной (Y). Он использует алгоритм для изучения функции отображения от входа к выходу. Это определено ниже —

Y = f(X)

Основная цель этого подхода состоит в аппроксимации функции отображения, и когда у вас есть новые входные данные (x), вы можете предсказать выходные переменные (Y) для этих данных.

Модель логистической регрессии

Логистическая регрессия — контролируемый алгоритм машинного обучения. Он используется для определения различий между классами K, используя взвешенную сумму переменных-предикторов. Он вычисляет вероятность возникновения события и может быть использован для обнаружения рака.

Biopython предоставляет модуль Bio.LogisticRegression для прогнозирования переменных на основе алгоритма логистической регрессии. В настоящее время Biopython реализует алгоритм логистической регрессии только для двух классов (K = 2).

k-Ближайшие соседи

k-Ближайшие соседи также являются контролируемым алгоритмом машинного обучения. Он работает путем классификации данных на основе ближайших соседей. Biopython предоставляет модуль Bio.KNN для прогнозирования переменных на основе алгоритма k-ближайших соседей.

Наивный байесовский

Наивные байесовские классификаторы представляют собой набор алгоритмов классификации, основанных на теореме Байеса. Это не отдельный алгоритм, а семейство алгоритмов, в которых все они придерживаются общего принципа, то есть каждая классифицируемая пара признаков не зависит друг от друга. Biopython предоставляет модуль Bio.NaiveBayes для работы с наивным байесовским алгоритмом.

Марковская модель

Марковская модель — это математическая система, определяемая как совокупность случайных величин, в которой происходит переход из одного состояния в другое в соответствии с определенными вероятностными правилами. Biopython предоставляет модули Bio.MarkovModel и Bio.HMM.MarkovModel для работы с марковскими моделями .