Шаг 135.
Язык Python. Визуализация данных. Библиотека Seaborn. Визуализация модели линейной регрессии. Функция regplot() (окончание)

    На этом шаге мы рассмотрим некоторые параметры этой функции.

    Рассмотрим некоторые из параметров функции regplot():

logistic: bool, optional
Если параметр равен True, то будет принято предположение, что у является бинарной переменной и для построения модели логистической регрессии будет использоваться модель из statsmodels.


Не забудьте установить модуль statsmodels.

    Добавим в набор данных iris ещё один признак: is_setosa, который принимает значение True, если ирис относится к классу setosa, иначе - значение False:

import matplotlib.pyplot as plt
import seaborn as sns

mpg = sns.load_dataset("mpg")
iris = sns.load_dataset("iris")

iris["is_setosa"] = iris["species"] == 'setosa'
sns.regplot(x="sepal_length", y="is_setosa", logistic=True, data=iris)

plt.show()
Архив с файлом можно взять здесь.


Рис.1. Демонстрация работы с параметром logistic функции regplot()

robust: bool, optional
Если параметр равен True, то будет использована модель из statsmodels для оценки робастной регрессии.

    Пример работы с параметром robust:

import matplotlib.pyplot as plt
import seaborn as sns

mpg = sns.load_dataset("mpg")
iris = sns.load_dataset("iris")

iris_mod = iris[iris["species"] == "setosa"]

sns.regplot(x="sepal_length", y="sepal_width", robust=True, data=iris_mod)

plt.show()
Архив с файлом можно взять здесь.


Рис.2. Демонстрация работы с параметром robust функции regplot()

logx: bool, optional
Если значение равно True, то оценивается линейная регрессия вида y ~ log(x). Значения параметра x должны быть больше нуля.

    Пример работы с параметром logx:

import matplotlib.pyplot as plt
import seaborn as sns

mpg = sns.load_dataset("mpg")
iris = sns.load_dataset("iris")

sns.regplot(x="mpg", y="displacement", logx=True, data=mpg)

plt.show()
Архив с файлом можно взять здесь.


Рис.3. Демонстрация работы с параметром logx функции regplot()

lowess: bool, optional
Если параметр равен True, то будет построена локально взвешенная линейная регрессия. Доверительный интервал для такой модели не отображается.

    Пример работы с параметром lowess:

import matplotlib.pyplot as plt
import seaborn as sns

mpg = sns.load_dataset("mpg")
iris = sns.load_dataset("iris")

sns.regplot(x="mpg", y="displacement", lowess=True, data=mpg)

plt.show()
Архив с файлом можно взять здесь.


Рис.4. Демонстрация работы с параметром lowess функции regplot()

order: int, optional
Если значение параметра больше 1, то будет использована функция numpy.polyfit для построения полиномиальной регрессии.

    Пример работы с параметром order:

import matplotlib.pyplot as plt
import seaborn as sns

mpg = sns.load_dataset("mpg")
iris = sns.load_dataset("iris")

order = [1, 2, 3]
plt.figure(figsize=(15, 5))
for i, o in enumerate(order):
    plt.subplot(1, len(order), i + 1)
    plt.title(f"order = {o}")
    sns.regplot(x="mpg", y="displacement", order=o, data=mpg)

plt.show()
Архив с файлом можно взять здесь.


Рис.5. Демонстрация работы с параметром order функции regplot()

truncate: bool, optional
По умолчанию линия регрессии отображается для всего диапазона оси x. Если параметр равен True, то линия будет ограничена крайними значениями набора данных.

    Пример работы с параметром truncate:

import matplotlib.pyplot as plt
import seaborn as sns

mpg = sns.load_dataset("mpg")
iris = sns.load_dataset("iris")

sns.regplot("mpg", y="displacement", truncate=True, data=mpg)

plt.show()
Архив с файлом можно взять здесь.


Рис.6. Демонстрация работы с параметром truncate функции regplot()

    На следующем шаге мы рассмотрим функцию residplot().




Предыдущий шаг Содержание Следующий шаг