На этом шаге мы рассмотрим функцию, используемую для построения такого графика.
Загрузим набор данных mpg:
mpg = sns.load_dataset("mpg")
Функция load_dataset() формирует набор данных и возвращает его в виде объекта pandas.DataFrame. В наборе mpg содержится информация о характеристиках ряда автомобилей. Более подробную информацию об нём можете прочитать в autompg-dataset.
Для визуальной оценки содержимого набора данных воспользуемся методом head() объекта класса DataFrame:
mpg.head()
Рис.1. Набор данных mpg
Построим зависимость ускорения (acceleration) от количества лошадиных сил (horsepower), при этом размер точки будет определяться количеством цилиндров:
import matplotlib.pyplot as plt import pandas as pd import numpy as np import seaborn as sns import pprint mpg = sns.load_dataset("mpg") # mpg.head() pprint.pprint(mpg) # Вывод набора данных sns.relplot(x="horsepower", y="acceleration", size="cylinders", data=mpg) plt.show()
Результат работы приложения изображен на рисунке 2.
Рис.2. Демонстрация работы функции relplot(), вариант: диаграмма рассеяния
На следующем шаге мы рассмотрим построение линейного графика.