Шаг 81.
Введение в машинное обучение с использованием Python. Методы машинного обучения без учителя ... . Проблемы машинного обучения без учителя

    На этом шаге мы перечислим основные проблемы машинного обучения без учителя.

    Главная проблема машинного обучения без учителя - оценка полезности информации, извлеченной алгоритмом. Алгоритмы машинного обучения без учителя, как правило, применяются к данным, которые не содержат никаких меток, таким образом, мы не знаем, каким должен быть правильный ответ. Поэтому очень трудно судить о качестве работы модели. Например, наш гипотетический алгоритм кластеризации мог бы сгруппировать вместе все фотографии лиц в профиль и все фотографии лиц в анфас. Перед нами, несомненно, один из способов разбить коллекцию фотографий лиц на группы, но это совсем не то, что нам нужно. Тем не менее у нас нет никакой возможности "рассказать" алгоритму, что мы ищем, и часто единственный способ оценить результат работы алгоритма машинного обучения без учителя - ручная проверка этого результата.

    Как следствие, алгоритмы машинного обучения без учителя часто используются в разведочных целях, когда специалист хочет лучше изучить сами данные. Еще одно общераспространенное применение алгоритмов машинного обучения без учителя заключается в том, что они служат этапом предварительной обработки данных для алгоритмов машинного обучения с учителем. Изучение нового представления данных иногда может повысить правильность алгоритмов машинного обучения с учителем или может привести к снижению времени вычислений и потребления объема памяти.

    Прежде чем начать знакомство с "реальными" алгоритмами машинного обучения без учителя, мы кратко рассмотрим некоторые простые методы предварительной обработки данных, которые часто могут пригодиться. Хотя предварительная обработка данных и масштабирование часто применяются вместе с алгоритмами контролируемого обучения, методы масштабирования не используют учителя, что делает их методами неконтролируемого обучения.

    На следующем шаге мы рассмотрим предварительную обработку и масштабирование.




Предыдущий шаг Содержание Следующий шаг