Шаг 154.
Глубокое обучение на Python. Обобщенный процесс машинного обучения. Определение задачи. Сбор данных. Вложения в инфраструктуру маркировки данных

    На этом шаге мы оценим проблемы, возникающие при организации этой работы.

    Процесс маркировки данных определяет качество целевых значений, которые, в свою очередь, определяют качество модели. Внимательно изучите доступные вам варианты такие, как:

    Аутсорсинг (маркировка сторонними исполнителями) может помочь сэкономить ваше время и деньги, но лишает вас контроля. Использование такой платформы, как Mechanical Turk, вероятно, обойдется еще дешевле, но качество маркировки может оказаться довольно низким.

    Оценивая варианты, учитывайте имеющиеся ограничения.

    Если вы решите маркировать данные самостоятельно, то спросите себя, какое программное обеспечение будете использовать для записи меток . Возможно, вам придется его разработать самим. Эффективное программное обеспечение для маркировки данных может помочь сэкономить много времени, поэтому уделите ему должное внимание на ранней стадии развития проекта

    На следующем шаге мы рассмотрим вред, наносимый нерепрезентативными данными.




Предыдущий шаг Содержание Следующий шаг