Шаг 160.
Глубокое обучение на Python. Обобщенный процесс машинного обучения. Разработка модели. Подготовка данных. Векторизация

    На этом шаге мы рассмотрим необходимость векторизации.

    Желательно, чтобы все входы и цели в нейронной сети были тензорами чисел с плавающей точкой (или в особых случаях тензорами целых чисел). Какие бы данные вам ни требовалось обработать - звук, изображение, текст, - их сначала нужно преобразовать в тензоры. Этот шаг называется векторизацией данных. Например, в двух предыдущих примерах классификации текстовых данных (шаги 94 и 101) мы начали с того, что преобразовали текст в списки целых чисел (представляющие последовательности слов) и применили прямое кодирование для превращения списков в тензоры данных типа float32. В примерах классификации изображений цифр и предсказания цен на дома исходные данные уже имели векторизованную форму, поэтому мы пропустили этот шаг.

    На следующем шаге мы рассмотрим нормализацию значений.




Предыдущий шаг Содержание Следующий шаг