6 видов контролируемого обучения, о которых вы должны знать в 2022 году

Опубликовано: 2021-01-10

Машинное обучение — одно из самых распространенных применений искусственного интеллекта. Машина учится выполнять задачи на основе поступающих в нее данных. А с опытом его работоспособность в заданной задаче улучшается. Машинное обучение включает контролируемые, неконтролируемые и усиленные методы обучения. Узнайте больше о типах машинного обучения.

В этой статье мы рассмотрим различные виды обучения с учителем.

Оглавление

Что такое контролируемое обучение?
Как это работает?
Различные типы контролируемого обучения
- 1. Регрессия
- 2. Классификация
- 3. Наивная байесовская модель
- 4. Модель случайного леса
- 5. Нейронные сети
- 6. Машины опорных векторов
Плюсы и минусы контролируемого обучения
Подведение итогов
В чем смысл контролируемого обучения?
В чем разница между классификацией и регрессией?
Что такое случайный лес?

Что такое контролируемое обучение?

В контролируемом обучении машина обучается с использованием «помеченных» данных. Наборы данных называются помеченными, если они содержат как входные, так и выходные параметры. Другими словами, данные уже отмечены правильным ответом.

Таким образом, метод имитирует классную среду, в которой ученик учится в присутствии супервайзера или учителя. С другой стороны, алгоритмы обучения без учителя позволяют моделям находить информацию и учиться самостоятельно.

Контролируемое машинное обучение чрезвычайно полезно при решении реальных вычислительных задач. Алгоритм прогнозирует результаты для непредвиденных данных, изучая помеченные обучающие данные. Поэтому для создания и развертывания таких моделей требуются высококвалифицированные специалисты по данным. Со временем специалисты по данным также используют свой технический опыт для перестройки моделей, чтобы сохранить целостность данных.

Как это работает?

Например, вы хотите научить машину прогнозировать время в пути между офисом и домом. Во-первых, вы должны создать помеченный набор данных, таких как погода, время суток, выбранный маршрут и т. д., который будет содержать ваши входные данные. И результатом будет предполагаемая продолжительность вашего пути домой в определенный день.

После того, как вы создадите тренировочный набор на основе соответствующих факторов, машина увидит отношения между точками данных и использует их, чтобы определить, сколько времени вам потребуется, чтобы вернуться домой. Например, мобильное приложение может сообщить вам, что ваше время в пути будет больше, когда идет сильный дождь.

Компьютер также может видеть другие связи в ваших помеченных данных, например, время вашего ухода с работы. Вы можете добраться до дома раньше, если начнете движение до того, как на дорогах появится пробка. Узнайте больше, если вам интересно узнать, как работает неконтролируемое машинное обучение.

Теперь давайте попробуем понять контролируемое обучение с помощью другого примера из реальной жизни. Предположим, у вас есть корзина с фруктами, и вы обучаете машину всевозможным фруктам. Учебные данные могут включать следующие сценарии:

Если объект красного цвета, круглой формы и имеет углубление на вершине, обозначьте его как «Яблоко».
Если предмет имеет зеленовато-желтый цвет и форму изогнутого цилиндра, отметьте его как «Банан».

Затем вы даете новый объект (тестовые данные) и просите машину определить, банан это или яблоко. Он будет учиться на обучающих данных и применять полученные знания для классификации фруктов в соответствии с введенными цветами и формами.

Различные типы контролируемого обучения

1. Регрессия

В регрессии одно выходное значение создается с использованием обучающих данных. Это значение является вероятностной интерпретацией, которая устанавливается после рассмотрения силы корреляции между входными переменными. Например, регрессия может помочь предсказать цену дома на основе его местоположения, размера и т. д.

В логистической регрессии выходные данные имеют дискретные значения, основанные на наборе независимых переменных. Этот метод может дать сбой при работе с нелинейными и множественными границами решений. Кроме того, он недостаточно гибок, чтобы фиксировать сложные отношения в наборах данных.

2. Классификация

Он включает в себя группировку данных по классам. Если вы думаете о предоставлении кредита какому-либо лицу, вы можете использовать классификацию, чтобы определить, будет ли это лицо неплательщиком по кредиту. Когда алгоритм обучения с учителем разделяет входные данные на два разных класса, это называется бинарной классификацией. Множественная классификация означает разделение данных более чем на два класса.

3. Наивная байесовская модель

Байесовская модель классификации используется для больших конечных наборов данных. Это метод присвоения меток классов с использованием прямого ациклического графа. Граф содержит один родительский узел и несколько дочерних узлов. И предполагается, что каждый дочерний узел независим и отделен от родителя.

Деревья решений

Дерево решений — это модель, похожая на блок-схему, которая содержит операторы условного управления, включая решения и их вероятные последствия. Вывод относится к маркировке непредвиденных данных.

В древовидном представлении листовые узлы соответствуют меткам классов, а внутренние узлы представляют атрибуты. Дерево решений можно использовать для решения задач с дискретными атрибутами, а также с булевыми функциями. Некоторыми из известных алгоритмов дерева решений являются ID3 и CART.

4. Модель случайного леса

Модель случайного леса представляет собой ансамблевый метод. Он работает путем построения множества деревьев решений и выводит классификацию отдельных деревьев. Предположим, вы хотите предсказать, кто из студентов бакалавриата будет хорошо сдавать GMAT — тест, сдаваемый при поступлении на программы управления выпускниками. Модель случайного леса выполнит эту задачу, учитывая демографические и образовательные факторы набора студентов, ранее сдавших тест.

5. Нейронные сети

Этот алгоритм предназначен для кластеризации необработанных входных данных, распознавания шаблонов или интерпретации сенсорных данных. Несмотря на свои многочисленные преимущества, нейронные сети требуют значительных вычислительных ресурсов. Может быть сложно подогнать нейронную сеть, когда есть тысячи наблюдений. Его также называют алгоритмом «черного ящика», поскольку интерпретация логики их прогнозов может быть сложной задачей.

Читайте : 10 лучших архитектур нейронных сетей в 2020 году

6. Машины опорных векторов

Машина опорных векторов (SVM) — это алгоритм обучения с учителем, разработанный в 1990 году. Он основан на теории статистического обучения, разработанной Вапом Ником.

SVM разделяет гиперплоскости, что делает его дискриминационным классификатором. Вывод производится в виде оптимальной гиперплоскости, которая классифицирует новые примеры. SVM тесно связаны с каркасом ядра и используются в различных областях. Некоторые примеры включают биоинформатику, распознавание образов и поиск мультимедийной информации.

Плюсы и минусы контролируемого обучения

Несколько типов обучения с учителем позволяют собирать и обрабатывать данные из предыдущего опыта. От оптимизации критериев производительности до решения реальных проблем контролируемое обучение стало мощным инструментом в области ИИ. Это также более надежный метод по сравнению с неконтролируемым обучением, которое в некоторых случаях может быть сложным в вычислительном отношении и менее точным.

Однако контролируемое обучение имеет свои ограничения. Для обучения классификаторов требуются конкретные примеры, а границы решений могут быть перетренированы в отсутствие правильных примеров. Можно также столкнуться с трудностями при классификации больших данных.

Подведение итогов

Суть обучения с учителем заключается в том, что оно использует помеченные данные для обучения машины. Методы регрессии и алгоритмы классификации помогают разрабатывать прогностические модели, обладающие высокой надежностью и имеющие множество применений.

Обучение под наблюдением требует от экспертов создания, масштабирования и обновления моделей. При отсутствии технических навыков для определения входных переменных может применяться грубая сила. И это может привести к неточным результатам. Таким образом, выбор соответствующих функций данных необходим для эффективной работы контролируемого обучения.

Сначала следует решить, какие данные требуются для обучающего набора, продолжить структурирование изученной функции и алгоритма, а также собрать результаты от экспертов и измерений. Такие передовые методы могут иметь большое значение для поддержки точности модели.

Поскольку искусственный интеллект и машинное обучение набирают обороты в современном мире, ориентированном на технологии, знание типов обучения с учителем может стать важным отличием в любой области. Объяснения выше помогут вам сделать этот первый шаг!

Если вам интересно узнать больше о машинном обучении, ознакомьтесь с дипломом PG IIIT-B и upGrad в области машинного обучения и искусственного интеллекта , который предназначен для работающих профессионалов и предлагает более 450 часов тщательного обучения, более 30 тематических исследований и заданий, IIIT- Статус B Alumni, 5+ практических проектов и помощь в трудоустройстве в ведущих фирмах.

Изучите курс машинного обучения в лучших университетах мира. Заработайте программы Masters, Executive PGP или Advanced Certificate Programs, чтобы ускорить свою карьеру.

В чем смысл контролируемого обучения?

Машина учится, используя «помеченные» данные в обучении с учителем. Когда набор данных имеет как входные, так и выходные параметры, он считается помеченным. Другими словами, информация уже помечена правильным ответом. В реальных вычислительных задачах машинное обучение с учителем весьма полезно. Система учится на размеченных обучающих данных, чтобы прогнозировать результаты для непредвиденных данных. В результате создание и развертывание таких моделей требует опыта высококвалифицированных специалистов по данным. Специалисты по данным используют свои технические знания для построения моделей с течением времени, чтобы сохранить достоверность полученных сведений.

В чем разница между классификацией и регрессией?

Используя обучающие данные, регрессия дает одно выходное значение. Это вероятностная интерпретация, которая определяется с учетом силы корреляции между входными переменными. Регрессия, например, может помочь спрогнозировать цену дома на основе его местоположения, размера и других факторов. Акт классификации данных влечет за собой их разделение на категории. Вы можете использовать категоризацию, чтобы оценить, не выполнит ли человек обязательства по кредиту, если вы рассматриваете возможность предоставления ему кредита. Двоичная классификация происходит, когда алгоритм обучения с учителем классифицирует входные данные на два отдельных класса. Множественная классификация относится к разделению информации более чем на две группы.

Что такое случайный лес?

Метод ансамбля представляет собой модель случайного леса. Он работает, создавая большое количество деревьев решений, а затем классифицируя отдельные деревья. Допустим, вы хотите узнать, студенты каких университетов хорошо сдадут GMAT — экзамен, необходимый для поступления на программы управления выпускниками. Учитывая демографические и образовательные характеристики группы студентов, ранее сдавших тест, модель случайного леса могла бы выполнить поставленную задачу.