Шаг 105.
Язык Python. Визуализация данных.
Библиотека Seaborn. Визуализация категориальных данных (общие сведения)

    На этом шаге мы перечислим функции, используемые для визуализации категориальных данных.

    При анализе данных часто приходится работать с категориальными признаками, их особенность состоит в том, что они принимают значения из неупорядоченного множества. К этой группе можно отнести такие признаки как цвет (автомобиля, фрукта), форма (квадрат, круг, треугольник) и т.п. Важным является то, что для такого типа данных не вводится отношение порядка, т.е. нельзя применить операцию больше или меньше для их сравнения.

    Есть более частный вид категориальных признаков - это порядковые признаки. Они по своей природе не являются числами, но для них уже можно определить операцию сравнения, примерами таких признаков могут быть тип автомобиля (легковой, грузовой), образование (бакалавр, магистр, кандидат наук, доктор наук).

    Seaborn предоставляет инструменты для визуализации наборов категориальных данных в виде точечных диаграмм и их оценки, и средства представления распределений категориальных данных. Функция catplot() является общим интерфейсом для всех функций работы с категориальными данными с возможностью модифицировать фигуру (подложку), идейно она повторяет функцию relplot() из 103 шага. Список функций приведён в таблице 1.

Таблица 1. Функции для визуализации категориальных данных
Имя функции Описание
catplot() Общий интерфейс для работы с категориальными данными с возможностью модификации подложки
stripplot() Инструменты для визуализации категориальных данных в виде точечных диаграмм
swarmplot()
boxplot() Инструменты для визуализации распределений категориальных данных
violinplot()
boxenplot()
pointplot() Инструменты для визуализации оценки категориальных данных
barplot()
countplot()

    На следующем шаге мы рассмотрим общие параметры этих функций.




Предыдущий шаг Содержание Следующий шаг