Шаг 132.
Язык Python. Визуализация данных.
Библиотека Seaborn. Визуализация модели линейной регрессии. Функция regplot()

    На этом шаге мы рассмотрим назначение и параметры этй функции.

    Функция regplot() отображает набор данных и линию регрессии, построенную по ним. Загрузим наборы данных iris и mpg:

mpg = sns.load_dataset("mpg")
iris = sns.load_dataset("iris")

    Построим линию регрессии зависимости расстояния, которое может проехать автомобиль, от его мощности. Через параметры x и y передаём названия признаков, через data - набор данных.

sns.lmplot(x="horsepower", y="displacement", data=mpg)

    Полный текст приложения:

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import seaborn as sns

mpg = sns.load_dataset("mpg")
iris = sns.load_dataset("iris")

sns.lmplot(x="horsepower", y="displacement", data=mpg)

plt.show()
Архив с файлом можно взять здесь.


Рис.1. Демонстрация работы функции regplot()

    Из набора iris выберем только те ирисы, которые относятся к классу setosa:

iris_mod = iris[iris["species"] == "setosa"]

    Построим зависимость ширины от длины наружной доли околоцветника:

sns.regplot(x="sepal_length", y="sepal_width", data=iris_mod)

    Полный текст приложения:

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import seaborn as sns

mpg = sns.load_dataset("mpg")
iris = sns.load_dataset("iris")

iris_mod = iris[iris["species"] == "setosa"]
sns.regplot(x="sepal_length", y="sepal_width", data=iris_mod)

plt.show()
Архив с файлом можно взять здесь.


Рис.2. Визуализации зависимости параметров sepal_length и sepal_width из набора данных iris

    С поля графика можно убрать либо точки (параметр scatter), либо регрессионную прямую (параметр fit_reg). Продемонстрируем это, присвоим параметру scatter значение False:

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import seaborn as sns

mpg = sns.load_dataset("mpg")
iris = sns.load_dataset("iris")

iris_mod = iris[iris["species"] == "setosa"]
sns.regplot(x="sepal_length", y="sepal_width",
            data=iris_mod, scatter=False)

plt.show()
Архив с файлом можно взять здесь.


Рис.3. Демонстрация работы с параметром scatter функции regplot()

    Зададим параметру fit_reg значение False:

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import seaborn as sns

mpg = sns.load_dataset("mpg")
iris = sns.load_dataset("iris")

iris_mod = iris[iris["species"] == "setosa"]
sns.regplot(x="sepal_length", y="sepal_width",
            data=iris_mod, fit_reg=False)

plt.show()
Архив с файлом можно взять здесь.


Рис.4. Демонстрация работы с параметром fit_reg функции regplot()

    На следующем шаге мы продолжим изучение этого вопроса.




Предыдущий шаг Содержание Следующий шаг