Шаг 7.
Введение в машинное обучение с использованием Python.
Введение. scikit-learn. Установка scikit-learn
На этом шаге мы рассмотрим несколько пакетов, включающих scikit-learn.
scikit-learn требует наличия еще двух пакетов Python - NumPy и SciPy. Для построения графиков и интерактивной работы
необходимо также установить matplotlib, IPython и Jupyter Notebook. Мы рекомендуем использовать один из нижеперечисленных
дистрибутивов Python, которые уже включают все необходимые пакеты:
- Anaconda
- Дистрибутив Python, предназначенный для крупномасштабной обработки данных, прогнозной аналитики и научных вычислений.
Anaconda уже включает NumPy, SciPy, matplotlib, pandas, IPython, Jupyter Notebook и scikit-learn.
Есть версии для Mac OS, Windows и Linux. Это очень удобное решение и это тот дистрибутив, который мы рекомендуем
пользователям, у которых еще не установлены пакеты Python для научных вычислений. Кроме того, сейчас Anaconda включает в себя
коммерческую библиотеку Intel MKL, которой можно пользоваться бесплатно. Использование MKL (это происходит автоматически при
установке Anaconda) может дать значительный прирост скорости при выполнении различных алгоритмов в scikit-learn.
- Enthought Canopy
- Еще один дистрибутив Python для научных вычислений. Он уже содержит NumPy, SciPy, matplotlib, pandas и IPython, но
бесплатная версия не включает scikit-learn. Если вы являетесь учебным заведением, вы можете запросить учебную лицензию и получить свободный
доступ к платной версии Enthought Canopy. Enthought Canopy доступен для Python 2.7.x и работает на Mac OS, Windows и Linux.
- Python (х, у)
- Свободный дистрибутив Python для научных вычислений, специально предназначенный для Windows. Python (х, у) включает
NumPy, SciPy, matplotlib, pandas, IPython и scikit-learn.
Если у вас уже стоит Python, вы можете использовать pip для установки всех этих пакетов:
$ pip install numpy scipy matplotlib ipython scikit-learn pandas
На следующем шаге мы рассмотрим основные библиотеки и инструменты.
Предыдущий шаг
Содержание
Следующий шаг