На этом шаге мы рассмотрим, в чем суть машинного обучения с учителем.

Основная цель машинного обучения - безошибочные прогнозы на основе имеющихся данных. Пусть нам нужно написать алгоритм для предсказания курса конкретных акций на следующие два дня. Для этого необходимо обучить модель МО. Но что такое модель?

С точки зрения пользователя машинного обучения, модель МО представляет собой "черный ящик" (рисунок 1), на вход которого подаются данные, а на выходе получаются предсказания.

Рис.1. Модель машинного обучения в виде "черного ящика"

В этой модели входные данные - числовое значение или многомерный вектор числовых значений - обозначаются переменной x и называются признаками (features). Далее "черный ящик" делает фокус-покус и обрабатывает введенные данные. Через некоторое время он возвращает предсказание у - выходной сигнал модели на основе заданных входных признаков. В задачах регрессии предсказание состоит из одного или нескольких числовых значений - как и входные признаки.

Машинное обучение с учителем делится на два отдельных этапа:

обучение и
выполнение вывода.

Этап обучения

На этапе обучения мы демонстрируем модели, каким должен быть выходной сигнал у' при заданном входном сигнале х. Выданное моделью предсказание у сравнивается с у', и в случае их расхождения модель обновляется так, чтобы генерировать более близкий к у' выходной сигнал, как показано на рисунке 2.

Рис.2. Этап обучения модели

Посмотрим на пример из сферы распознавания образов. Представьте, что мы обучаем модель предсказывать названия фруктов (выходные сигналы) по их изображениям (входные сигналы). Например, на одном из обучающих изображений показан банан, но модель ошибочно говорит, что это яблоко. Поскольку желаемый выходной сигнал отличается от прогноза модели, мы меняем ее, чтобы в следующий раз она правильно выдавала предсказание банан.

Демонстрация модели желаемых выходных сигналов для различных входных сигналов и ее подгонка и означают обучение модели на обучающих данных. Со временем модель усваивает, какие выходные сигналы вы хотели бы видеть для конкретных входных сигналов. Именно поэтому в XXI столетии так важны данные: модель хороша настолько, насколько хороши ее обучающие данные. Без хороших обучающих данных модель заведомо не покажет хороших результатов. Проще говоря, обучающие данные играют роль "учителя", направляющего процесс машинного обучения. Отсюда и название машинное обучение с учителем.

Этап выполнения вывода

На этапе выполнения вывода обученная модель используется с целью предсказания выходных значений для новых входных признаков х. Обратите внимание, что модель способна предсказывать выходные сигналы для никогда не встречавшихся в обучающих данных входных сигналов. Например, модель предсказания фруктов с этапа обучения теперь может определять их названия (усвоенные из обучающих данных) на изображениях, никогда ранее ей не встречавшихся. Другими словами, адекватные модели машинного обучения обладают способностью к обобщению (generalization), то есть умеют использовать накопленный на обучающих данных опыт, чтобы предсказывать результаты для новых входных сигналов. Проще говоря, хорошо обобщающие модели генерируют безошибочные предсказания для новых входных данных. Полученные в результате обобщения предсказания для входных данных, не встречавшихся модели, - одна из сильных сторон машинного обучения, а также основная причина его популярности среди широкого спектра приложений.

На следующем шаге мы рассмотрим линейную регрессию.

Предыдущий шаг Содержание Следующий шаг