3 Типа машинного обучения

3 Типа машинного обучения - манекены
< Машинное обучение приходит во множестве разных вкусов, в зависимости от алгоритма и его целей. Вы можете разделить алгоритмы машинного обучения на три основные группы в зависимости от их назначения:

Обучаемое обучение

  • Неконтролируемое обучение
  • Усиление обучения
  • Обучаемое обучение

Наблюдаемое обучение

происходит, когда алгоритм учится на примере данные и связанные с ними целевые ответы, которые могут состоять из числовых значений или строковых меток, таких как классы или теги, чтобы позже предсказать правильный ответ, когда они представлены с новыми примерами. Подконтрольный подход действительно похож на человеческое обучение под наблюдением учителя. Учитель дает хорошие примеры для запоминания студентом, и тогда ученик получает общие правила из этих конкретных примеров.

Вам нужно различать проблемы регрессии, целью которых является числовое значение и проблемы классификации, целью которых является качественная переменная, такая как класс или тег. Задача регрессии определяет средние цены на дома в районе Бостона, а в задачах классификации различаются виды цветков радужной оболочки, основанные на их мешках и лепестках.

Неконтролируемое обучение

Неконтролируемое обучение

происходит, когда алгоритм учится на простых примерах без какого-либо связанного ответа, оставляя алгоритму самостоятельно определять шаблоны данных. Этот тип алгоритма имеет тенденцию реструктурировать данные во что-то другое, например новые функции, которые могут представлять класс или новую серию некоррелированных значений. Они весьма полезны для того, чтобы дать людям понять смысл данных и новые полезные материалы для контролируемых алгоритмов машинного обучения.

В качестве своего рода обучения он напоминает методы, которые люди используют для определения того, что определенные объекты или события относятся к одному классу, например, наблюдая степень сходства между объектами. Некоторые системы рекомендаций, которые вы найдете в Интернете в форме автоматизации маркетинга, основаны на этом типе обучения.

Алгоритм автоматизации маркетинга получает свои предложения от того, что вы купили в прошлом. Рекомендации основаны на оценке того, какая группа клиентов вы больше всего напоминаете, а затем выведите свои вероятные предпочтения на основе этой группы.

Усиление обучения

Усиление обучения

происходит, когда вы представляете алгоритм примерами, которым не хватает ярлыков, как при неконтролируемом обучении. Тем не менее, вы можете сопровождать пример положительной или отрицательной обратной связью в соответствии с решением, предложенным алгоритмом.Укрепление обучения связано с приложениями, для которых алгоритм должен принимать решения (поэтому продукт является предписывающим, а не просто описательным, как при неконтролируемом обучении), и решения имеют последствия. В человеческом мире это похоже на обучение методом проб и ошибок. Ошибки помогают вам учиться, потому что у них есть штраф (стоимость, потеря времени, сожаление, боль и т. Д.), Обучая вас тому, что определенный курс действий с меньшей вероятностью преуспеет, чем другие. Интересный пример обучения усилению происходит, когда компьютеры учатся самостоятельно играть в видеоигры.

В этом случае приложение представляет алгоритм с примерами конкретных ситуаций, например, если геймер застрял в лабиринте, избегая при этом врага. Приложение позволяет алгоритму знать результат действий, которые он принимает, и обучение происходит, пытаясь избежать того, что он обнаруживает, чтобы быть опасным и продолжать выживать. Вы можете посмотреть, как компания Google DeepMind создала программу обучения подкреплению, которая воспроизводит видеоигры старых Atari. При просмотре видео обратите внимание на то, что программа изначально неуклюжая и неквалифицированная, но неуклонно улучшается с обучением, пока она не станет чемпионом.