На этом шаге мы укажем основную цель кластеризации.
Как мы уже говорили выше, кластеризация (clustering) является задачей разбиения набора данных на группы, называемые кластерами. Цель - разделить данные таким образом, чтобы точки, находящие в одном и том же кластере, были очень схожи друг с другом, а точки, находящиеся в разных кластерах, отличались друг от друга. Как и алгоритмы классификации, алгоритмы кластеризации присваивают (или прогнозируют) каждой точке данных номер кластера, которому она принадлежит.
На следующем шаге мы рассмотрим кластеризацию k-средних.