Шаг 112.
Введение в машинное обучение с использованием Python. Методы машинного обучения без учителя и предварительная обработка данных. Выводы и перспективы

    На этом шаге мы дадим некоторые рекомендации по использованию изученного материала.

    Материал в изложенных шагах познакомил вас с целым рядом алгоритмов неконтролируемого обучения, которые можно применить для разведочного анализа данных и предварительной обработки. Наличие адекватных данных часто имеет решающее значение для успешного применения алгоритмов контролируемого или неконтролируемого обучения, поэтому методы предварительной обработки и декомпозиционные методы играют важную роль в подготовке данных.

    Декомпозиционные методы, множественное обучение и кластеризация являются необходимыми инструментами для дальнейшего понимания ваших данных, и могут быть теми единственными средствами, которые придадут смысл вашим данным при отсутствии контрольной информации. Даже при наличии контрольной информации инструменты разведочного анализа имеют важное значение с точки зрения лучшего понимания свойств данных. Зачастую полезность алгоритмов неконтролируемого обучения трудно оценить, однако это не должно удерживать вас от использования этих алгоритмов с целью получения более глубокого представления о данных. Включив в свой арсенал эти методы, вы теперь экипированы всеми необходимыми алгоритмами, которыми специалисты по машинному обучению пользуются ежедневно.

    Мы рекомендуем вам применять кластеризацию и декомпозиционные методы как к двумерным синтетическим данным, так и к реальным наборам данных, включенным в scikit-learn, типа наборов digits, iris и cancer.

    На следующем шаге мы рассмотрим выводы по интерфейсу моделей.




Предыдущий шаг Содержание Следующий шаг