Шаг 102.
Язык Python. Визуализация данных. Библиотека Seaborn. ... . Настройка внешнего вида элементов поля графика. Сортировка набора данных

    На этом шаге мы рассмотрим управление сортировкой данных.

    По умолчанию, перед тем как отобразить график, Seaborn производит сортировку набора данных, эту опцию можно отключить, задав параметру sort значение False.

    Построим зависимость мощности двигателя от года выпуска автомобиля:

import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns
import pandas as pd

df = sns.load_dataset('mpg')
sns.lineplot(x='model_year', y='horsepower', data=df)

plt.show()
Архив с файлом можно взять здесь.


Рис.1. График зависимости параметра horsepower от model_year до перемешивания набора данных

    Перемешаем набор данных и снова построим график зависимости выбранных параметров:

import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns
import pandas as pd

df = sns.load_dataset('mpg')
df = df.sample(frac=1) # Перемешивание набора данных
sns.lineplot(x='model_year', y='horsepower', data=df)

plt.show()
Архив с файлом можно взять здесь.


Рис.2. График зависимости параметра horsepower от model_year после перемешивания набора данных

    Как вы можете видеть ничего не поменялось в сравнении с результатом, который мы получали без перемешивания (рисунок 1). Отключим опцию предварительной сортировки:

import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns
import pandas as pd

df = sns.load_dataset('mpg')
df = df.sample(frac=1) # Перемешивание набора данных
# Отключение опции предварительной
# сортировки (параметр sort)
sns.lineplot(x='model_year', y='horsepower', data=df, sort=False)

plt.show()
Архив с файлом можно взять здесь.


Рис.1. График зависимости параметра horsepower от model_year с отключённой опцией сортировки

    В этом случае график уже будет отличаться от приведённого выше варианта.

    На следующем шаге мы рассмотрим визуализацию отношений с настройкой подложки.




Предыдущий шаг Содержание Следующий шаг