Шаг 78.
Задачи ComputerScience на Python.
Кластеризация методом k-средних. Реальные приложения

    На этом шаге мы перечислим те области, где используется кластеризация.

    Кластеризация - это то, чем часто приходится заниматься исследователям данных и аналитикам статистики. Она широко используется для интерпретации данных в различных областях. В частности, кластеризация методом k-средних является полезной технологией в тех случаях, когда о структуре набора данных известно немногое.

    Кластеризация - важная методика для анализа данных. Представьте себе полицейское управление, сотрудники которого хотят знать, как расставить полицейские патрули. Или руководителя франшизы предприятия быстрого питания, которому нужно выяснить, где находятся лучшие клиенты, чтобы рассылать рекламные предложения. Или оператора на борту судна, который стремится свести к минимуму аварии, анализируя, когда они происходят и кто является их причиной. Теперь подумайте, как все эти люди могли бы решить свои проблемы с помощью кластеризации.

    Кластеризация помогает при распознавании образов. Алгоритм кластеризации позволяет обнаруживать шаблоны, которые пропускает человеческий глаз. Например, кластеризация иногда используется в биологии для выявления групп несоответствующих клеток.

    При распознавании изображений кластеризация помогает идентифицировать неочевидные функции. Отдельные пиксели можно рассматривать как единицы данных, их отношение друг к другу определяется расстоянием и разницей цветов.

    В политологии кластеризация иногда применяется для поиска избирателей. Может ли политическая партия выявить избирателей, лишенных избирательных прав, сконцентрированных в одном округе, чтобы сосредоточить там свои затраты на избирательную кампанию? Какие проблемы могут вызывать опасения у подобных избирателей?

    Со следующего шага мы начнем рассматривать простейшие нейронные сети.




Предыдущий шаг Содержание Следующий шаг