Шаг 38.
Глубокое обучение на Python. Математические основы нейронных сетей. Представление данных для нейронных сетей. Изображения

    На этом шаге мы перечислим форматы изображений, используемые в Keras.

    Обычно изображения имеют три измерения: высоту, ширину и цвет. Даже притом, что черно-белые изображения (как в наборе данных MNIST) имеют только один канал цвета и могли бы храниться в двумерных тензорах, по соглашениям тензоры с изображениями всегда имеют три измерения, где для черно-белых изображений отводится только один канал цвета. Соответственно, пакет со 128 черно-белыми изображениями, имеющими размер 256 * 256, можно сохранить в тензоре с формой (128, 256, 256, 1), а пакет со 128 цветными изображениями - в тензоре с формой (128, 256, 256, 3) (рисунок 1).


Рис.1. Четырехмерный тензор с изображениями (в соответствии с соглашением "канал следует первым")

    В отношении форм тензоров с изображениями существует два соглашения: соглашение "канал следует последним" (используется в TensorFlow) и соглашение "канал следует первым" (которое все больше теряет популярность).

    По соглашению "канал следует последним" ось цвета помещается в конец: (образцы, высота, ширина, цвет). По соглашению "канал следует первым" ось цвета помещается сразу после оси пакетов: (образцы, цвет, высота, ширина). При следовании соглашению "канал следует первым" предыдущие примеры выглядели бы так: (128, 1, 256, 256) и (128, 3, 256, 256). Библиотека Keras поддерживает оба формата.

    На следующем шаге мы рассмотрим видео.




Предыдущий шаг Содержание Следующий шаг