Шаг 36.
Глубокое обучение на Python. Математические основы нейронных сетей. Представление данных для нейронных сетей. Векторные данные
На этом шаге мы приведем примеры данных, представимых векторами.
Наиболее часто встречающаяся форма данных. В таких наборах каждый образец может быть представлен вектором, а пакет соответственно - двумерным тензором
(то есть массивом векторов), где первая ось - это ось образцов, а вторая - ось признаков.
Рассмотрим два примера.
- Актуарный набор данных с информацией о людях, где для каждого человека указываются возраст, пол и доход. Каждый человек характеризуется вектором
с тремя значениями, соответственно весь набор данных, описывающий 100 000 человек, можно сохранить в двумерном тензоре с формой (100000, 3).
- Коллекция текстовых документов, где каждый документ представлен количеством повторений каждого слова (из словаря с 20 000 наиболее употребительных слов). Каждый
документ можно представить как вектор с 20 значениями (по одному счетчику на каждое слово из словаря), соответственно весь набор данных, описывающий 500
документов, можно сохранить в тензоре с формой (500, 20000).
На следующем шаге мы рассмотрим временные ряды или последовательности.
Предыдущий шаг
Содержание
Следующий шаг