На этом шаге мы определим дальнейшее направление деятельности.
Одна из проблем, связанных с применением алгоритмов кластеризации, заключается в том, что очень трудно оценить качество работы алгоритма и сравнить результаты, полученные с помощью различных алгоритмов. Рассказав об алгоритмах k-средних, агломеративной кластеризации и DBSCAN, мы теперь сравним их, применив к некоторым реальным наборам данных.
На следующем шаге мы дадим оценку качества кластеризации с помошью метрик, прелполагаюших знание истинной кластеризации.