На этом шаге мы перечислим эти задачи.
Ранее вы познакомились с основами использования глубокого обучения в технологиях компьютерного зрения на примере простых моделей (стеки слоев
Conv2D и MaxPooling2D), применяемых для решения простой задачи (бинарная классификация изображений). Но компьютерное зрение - это не
только классификация изображений! В последующих шагах будет рассмотрен более широкий круг задач и представлены некоторые продвинутые приемы.
До сих пор наше внимание было сосредоточено на моделях классификации изображений, которые принимают изображение и возвращают соответствующую ему метку: "Это изображение, вероятно, содержит кошку; а на этом, вероятно, присутствует собака". Но классификация изображений - лишь один из нескольких возможных вариантов применения глубокого обучения в компьютерном зрении.
В целом в данной сфере есть три основные задачи.
Рис.1. Три основные задачи компьютерного зрения: классификация, сегментация и обнаружение объектов
На следующем шаге мы рассмотрим пример сегментации изображения.