На этом шаге мы рассмотрим управление сортировкой данных.
По умолчанию, перед тем как отобразить график, Seaborn производит сортировку набора данных, эту опцию можно отключить, задав параметру sort значение False.
Построим зависимость мощности двигателя от года выпуска автомобиля:
import matplotlib.pyplot as plt import numpy as np import seaborn as sns import pandas as pd df = sns.load_dataset('mpg') sns.lineplot(x='model_year', y='horsepower', data=df) plt.show()
Рис.1. График зависимости параметра horsepower от model_year до перемешивания набора данных
Перемешаем набор данных и снова построим график зависимости выбранных параметров:
import matplotlib.pyplot as plt import numpy as np import seaborn as sns import pandas as pd df = sns.load_dataset('mpg') df = df.sample(frac=1) # Перемешивание набора данных sns.lineplot(x='model_year', y='horsepower', data=df) plt.show()
Рис.2. График зависимости параметра horsepower от model_year после перемешивания набора данных
Как вы можете видеть ничего не поменялось в сравнении с результатом, который мы получали без перемешивания (рисунок 1). Отключим опцию предварительной сортировки:
import matplotlib.pyplot as plt import numpy as np import seaborn as sns import pandas as pd df = sns.load_dataset('mpg') df = df.sample(frac=1) # Перемешивание набора данных # Отключение опции предварительной # сортировки (параметр sort) sns.lineplot(x='model_year', y='horsepower', data=df, sort=False) plt.show()
Рис.1. График зависимости параметра horsepower от model_year с отключённой опцией сортировки
В этом случае график уже будет отличаться от приведённого выше варианта.
На следующем шаге мы рассмотрим визуализацию отношений с настройкой подложки.