Шаг 67.
Введение в машинное обучение с использованием Python. ... . Ядерный метод опорных векторов. Премушества, недостатки и параметры

    На этом шаге мы подведем некоторые итоги.

    Ядерный метод опорных векторов - это модели, обладающие мощной прогнозной силой и хорошо работающие на различных наборах данных. SVM позволяет строить сложные решающие границы, даже если данные содержат лишь несколько признаков. Они хорошо работают на низкоразмерных и высокоразмерных данных (то есть когда у нас мало или, наоборот, много признаков), однако плохо масштабируются с ростом объема данных. Запуск SVM на наборе данных объемом 10000 наблюдений не составляет проблем, однако работа с наборами данных объемом 100000 наблюдений и больше может стать сложной задачей с точки зрения времени вычислений и использования памяти.

    Другим недостатком является то, что SVM требует тщательной предварительной обработки данных и настройки параметров. Именно поэтому сейчас многие специалисты в различных сферах вместо SVM используют модели на основе дерева, например, случайные леса или градиентный бустинг (который практически не требуют предварительную обработки данных). Кроме того, модели SVM трудно исследуемы, тяжело понять, почему был сделан именно такой прогноз и довольно сложно объяснить модель неспециалисту.

    Однако все же стоит попробовать SVM, особенно в тех случаях, когда все ваши признаки имеют одинаковые единицы измерения (например, все признаки являются интенсивностями пикселей) и измерены в одном и том же масштабе.

    Важными параметрами ядерного SVM являются параметр регуляризации C, тип ядра, а также параметры, определяемые ядром. Хотя мы в основном сосредоточились на ядре RBF, в scikit-learn доступны и другие типы ядер. Ядро RBF имеет лишь один параметр gamma, который является обратной величиной ширины гауссовского ядра. gamma и С регулируют сложность модели, более высокие значения этих параметров дают более сложную модель. Таким образом, оптимальные настройки обоих параметров, как правило, сильно взаимосвязаны между собой и поэтому С и gamma должны быть отрегулированы вместе.

    Со следующего шага мы начнем рассматривать нейронные сети.




Предыдущий шаг Содержание Следующий шаг