Шаг 86.
Глубокое обучение на Python. Введение в Keras и TensorFlow. Анатомия нейронной сети: знакомство с основами Keras. Выбор функции потерь

    На этом шаге мы поговорим о важности правильного выбора функции потерь.

    Выбор правильной функции потерь для решения конкретной задачи играет очень важную роль: ваша модель будет использовать любую возможность минимизировать потери, поэтому если функция потерь не отвечает полностью критериям успешного решения задачи, то модель в конечном счете может выдать совсем не тот результат, что вам нужен. Представьте глупый и всемогущий ИИ, обученный методом градиентного спуска, с неправильно выбранной целевой функцией: "максимизировать среднее благосостояние всех живущих людей". Чтобы упростить себе работу, такой ИИ мог бы уничтожить всех, кроме нескольких человек, и сосредоточиться на их потребностях, поскольку среднее благосостояние не зависит от количества оставшихся. Но мы же совсем не это имели в виду! Нейронные сети, которые вы строите, в минимизации функции потерь будут столь же беспощадны, поэтому мудро выбирайте цель, иначе вам придется столкнуться с неожиданными побочными эффектами

    К счастью, для типовых задач (таких как классификация, регрессия и предсказание последовательностей) имеются простые рекомендации, которым можно следовать при выборе функции потерь. Например, для классификации в две категории можно использовать функцию бинарной перекрестной энтропии, в несколько категорий - многозначной перекрестной энтропии и т. д. Свои функции потерь вам придется разрабатывать, только сталкиваясь с действительно новыми исследовательскими задачами. В следующих шагах мы подробно объясним, какие функции потерь стоит выбирать для распространенных задач.

    На следующем шаге мы рассмотрим метод fit().




Предыдущий шаг Содержание Следующий шаг