Шаг 70.
Язык Python. Визуализация данных.
Библиотека Seaborn. Быстрый старт. Построение точечного графика

    На этом шаге мы рассмотрим функцию, используемую для построения такого графика.

    Загрузим набор данных mpg:

  mpg = sns.load_dataset("mpg")

    Функция load_dataset() формирует набор данных и возвращает его в виде объекта pandas.DataFrame. В наборе mpg содержится информация о характеристиках ряда автомобилей. Более подробную информацию об нём можете прочитать в autompg-dataset.

    Для визуальной оценки содержимого набора данных воспользуемся методом head() объекта класса DataFrame:

  mpg.head()


Отметим, что в среде разработки PyCharm данный метод был проигнорирован. Скорее всего, он предназначен для использования в Jupyter Notebook. Для простой визуализации данных мы воспользовались методом pprint() из одноименного пакета. Результат его работы приведен на рисунке 1.


Рис.1. Набор данных mpg

    Построим зависимость ускорения (acceleration) от количества лошадиных сил (horsepower), при этом размер точки будет определяться количеством цилиндров:

import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
import seaborn as sns
import pprint

mpg = sns.load_dataset("mpg")
# mpg.head()
pprint.pprint(mpg)  # Вывод набора данных
sns.relplot(x="horsepower", y="acceleration",
            size="cylinders", data=mpg)
plt.show()
Архив с файлом можно взять здесь.

    Результат работы приложения изображен на рисунке 2.


Рис.2. Демонстрация работы функции relplot(), вариант: диаграмма рассеяния

    На следующем шаге мы рассмотрим построение линейного графика.




Предыдущий шаг Содержание Следующий шаг