Шаг 86.
Язык Python. Визуализация данных. Библиотека Seaborn. Визуализация отношений в данных. Общие параметры функций
На этом шаге мы перечислим общие параметры функций.
Рассмотрим параметры, которые являются общими для функций визуализации отношений в данных.
Базовые аргументы
Базовые аргументы функций:
- х, у: имена переменных из набора data, optional
- Связывают ось x и у с конкретными признаками из набора данных, переданного через параметр data. Данные должны иметь
числовой тип. Для функций lineplot() и scatterplot() допустимо передавать вектора с данными напрямую. Параметры могут иметь значение None,
в этом случае, будет визуализирован весь набор данных из data.
- data: DataFrame, optional
- Набор данных в формате pandas.DataFrame, в котором столбцы - это имена переменных, строки - значения. Имена столбцов, данные из которых
нужно визуализировать, передаются в параметры x и y.
Параметры для повышения информативности графиков
Для придания большей информативности графикам функции визуализации отношений в данных предоставляют следующие параметры:
- ci: int, 'sd' или None, optional
- Определяет размер отображаемого доверительного интервала. Если значение равно 'sd', то вместо доверительного интервала будет отображено
стандартное отклонение.
- hue: имя переменной из набора data, optional
- Задаёт признак в наборе данных, который будет использован для цветового разделения данных. Визуально группы будут представлены в виде отдельных
линий (точек), отличающихся цветом. Функции lineplot() и scatterplot() позволяют передавать вектора с данными в параметр напрямую, для
relplot() это недопустимо.
- palette: имя палитры, list, diet, optional
- Палитра, которая будет использована для цветового разделения набора данных по значениями признака, указанного в hue. Seaborn
предоставляет набор различных цветовых схем, которые можно использовать, более подробно о них рассказано на 83 шаге.
Можно указать свою цветовую схему через словарь, в котором определяется соответствие значений признака, переданного в hue, и цвета из библиотеки Matplotlib.
- hue_order: list, optional
- Задаёт порядок применения цветов для данных из набора, переданного через параметр hue.
- hue_norm: tuple или объект класса Normalize, optional
- Нормализация данных может применятся, если набор данных, указанный в hue параметре, имеет числовой тип. Для категориальных данных
нормализация не используется.
- size: имя переменной из набора data, optional
- Задаёт признак в наборе данных, который будет использован для разделения данных по размеру. Визуально группы будут представлены в виде отдельных
линий (точек), отличающихся шириной (размером). Функции lineplot() и scatterplot() позволяют передавать вектора с данными в параметр напрямую, для relplot() это не допустимо.
- size_order: list, optional
- Задаёт порядок распределения толщины линии между элементами из набора данных, заданного через параметр size.
- size_norm: tuple, объект класса Normalize, optional
- Определяет нормализацию для данных для набора, заданного через параметр size. Может использоваться только для численных значений.
- style: имя переменной из набора data, optional
- Задаёт признак в наборе данных, который будет использован для разделения данных по стилю. Визуально группы будут представлены в виде отдельных
линий (точек), отличающихся стилем линии и/или видом маркера. Функции lineplot() и scatterplot() позволяют передавать вектора с данными в
параметр напрямую, для relplot() это не допустимо.
- markers: bool, list, diet, optional
- Определяет тип маркеров. Если параметр равен False, то маркеры использоваться не будут, если True, то будут использованы маркеры по
умолчанию. Тип маркера можно задать через словарь, устанавливающий соответствие между значениями из набора данных, переданного через параметр style и кодом маркера.
Коды маркеров соответствуют используемым в Matplotlib.
- style_order: list, optional
- Задаёт порядок применения стилей.
На следующем шаге мы рассмотрим линейный график.
Предыдущий шаг
Содержание
Следующий шаг