Шаг 111.
Язык Python. Визуализация данных. Библиотека Seaborn. ... . Визуализации распределений категориальных данных (общие сведения)
На этом шаге мы приведем общие сведения о диаграммах распределений.
На практике, при решении задач статистики, чаще приходится строить не диаграммы рассеяния, а диаграммы распределений. По ним можно получить представление
об изучаемых наборах данных по ряду числовых характеристик, значения которых отображаются на такого типа диаграммах.
Seaborn предоставляет три функции для визуализации распределений категориальных данных:
- boxplot() - строит диаграмму типа "ящик с усами", иногда её называют через транскрипцию: боксплот, на ней отображаются медианное значение,
квартили и выбросы;
- violinplot() - строит диаграмму похожую на "ящик с усами" с оценкой плотности ядра;
- boxenplot() - строит диаграмму из прямоугольников, хорошо подходит для визуализации больших наборов данных.
Для настройки внешнего вида диаграмм используются параметры, перечисленные на 106 шаге. В
дополнение к ним функции имеют общий набор аргументов и индивидуальные элементы настройки. Рассмотрим общий набор дополнительных параметров для
функций визуализации распределений категориальных данных:
- saturation: float, optional
- Пропорция насыщенности цвета.
- width: float, optional
- Ширина элемента диаграммы (например ящика с усами).
- dodge: bool, optional
- Если параметр равен True и используется параметр hue, то на диаграмме данные будут представлены в виде визуально разделимых групп.
- linewidth: float, optional
- Ширина рамки элементов.
На следующем шаге мы рассмотрим функцию boxplot().
Предыдущий шаг
Содержание
Следующий шаг