На этом шаге мы рассмотрим назначение и примеры использования этой функции.
Функция residplot() отображает отклонения элементов исходного набора данных от регрессионной модели, построенной по ним, в виде диаграммы рассеяния. Каждая точка такой диаграммы - это разность между значением элемента исходного набора и значением, которое выдаст модель регрессии в этой точке. Параметры функции residplot() совпадают с набором, приведённым на 131 шаге "Общие параметры функций".
Приведём несколько примеров её использования. Будем работать с набором mpg:
mpg = sns.load_dataset("mpg")
Построим модель линейной регрессии с помощью функции regplot():
import matplotlib.pyplot as plt import seaborn as sns mpg = sns.load_dataset("mpg") sns.regplot(x="mpg", y="displacement", data=mpg) plt.show()
Рис.1. График модели линейной регрессии, построенный с помощью regplot()
Теперь построим диаграмму рассеяния отклонений значений набора данных от модели:
import matplotlib.pyplot as plt import seaborn as sns mpg = sns.load_dataset("mpg") sns.residplot(x="mpg", y="displacement", color='g', data=mpg) plt.show()
Рис.2. Диаграмма рассеяния отклонений значений набора данных от модели, построенная с помощью residplot()
Пример модели третьего порядка:
import matplotlib.pyplot as plt import seaborn as sns mpg = sns.load_dataset("mpg") sns.regplot(x="mpg", y="displacement", order=3, data=mpg) plt.show()
Рис.3. График модели третьего порядка
Для такой модели распределение отклонений будет таким:
import matplotlib.pyplot as plt import seaborn as sns mpg = sns.load_dataset("mpg") sns.residplot(x="mpg", y="displacement", color='g', order=3, data=mpg) plt.show()
Рис.4. Распределение отклонений для модели третьего порядка
На следующем шаге мы рассмотрим функцию lmplot().