На этом шаге мы дадим некоторые рекомендации по использованию изученного материала.
Материал в изложенных шагах познакомил вас с целым рядом алгоритмов неконтролируемого обучения, которые можно применить для разведочного анализа данных и предварительной обработки. Наличие адекватных данных часто имеет решающее значение для успешного применения алгоритмов контролируемого или неконтролируемого обучения, поэтому методы предварительной обработки и декомпозиционные методы играют важную роль в подготовке данных.
Декомпозиционные методы, множественное обучение и кластеризация являются необходимыми инструментами для дальнейшего понимания ваших данных, и могут быть теми единственными средствами, которые придадут смысл вашим данным при отсутствии контрольной информации. Даже при наличии контрольной информации инструменты разведочного анализа имеют важное значение с точки зрения лучшего понимания свойств данных. Зачастую полезность алгоритмов неконтролируемого обучения трудно оценить, однако это не должно удерживать вас от использования этих алгоритмов с целью получения более глубокого представления о данных. Включив в свой арсенал эти методы, вы теперь экипированы всеми необходимыми алгоритмами, которыми специалисты по машинному обучению пользуются ежедневно.
Мы рекомендуем вам применять кластеризацию и декомпозиционные методы как к двумерным синтетическим данным, так и к реальным наборам данных, включенным в scikit-learn, типа наборов digits, iris и cancer.
На следующем шаге мы рассмотрим выводы по интерфейсу моделей.