Что такое контролируемое машинное обучение? Алгоритм, Пример
Опубликовано: 2021-06-22Машинное обучение повсюду — от государственных учреждений, розничных услуг и финансовых учреждений до секторов здравоохранения, развлечений и транспорта. Это неразрывно связано с нашей повседневной жизнью, будь то Netflix или Amazon, дающие онлайн-рекомендации, или разблокировка вашего смартфона с помощью технологии распознавания лиц, машинного обучения и искусственного интеллекта набрали обороты, как никогда раньше.
Поскольку машинное обучение сейчас является одной из самых популярных технологических тенденций, становится необходимым знать об одном из ключевых подходов к созданию искусственного интеллекта — машинном обучении с учителем.
Оглавление
Что такое контролируемое машинное обучение?
Контролируемое машинное обучение — это тип машинного обучения, при котором компьютерный алгоритм обучается с использованием помеченных входных данных, а компьютер, в свою очередь, прогнозирует выходные данные для непредвиденных данных. Здесь «помечено» означает, что некоторые данные уже будут помечены правильными ответами, чтобы помочь машине учиться. При обучении с учителем входные данные, подаваемые на компьютер, работают как супервайзер или учитель, чтобы обучить машину выдавать точные результаты, обнаруживая основные закономерности и корреляции между входными данными и выходными метками.
Типы контролируемых алгоритмов обучения
Существуют различные типы алгоритмов обучения с учителем для достижения конкретных результатов. Давайте рассмотрим некоторые из наиболее распространенных типов.
1. Классификация
Алгоритмы классификации используют помеченные обучающие данные для сортировки входных данных по заданному количеству классов или категорий. Здесь выходной переменной является категория, такая как «Да» или «Нет» и «Истина» или «Ложь». Классификация медицинских отчетов на положительные (болезнь) или отрицательные (отсутствие болезни) или классификация фильмов по разным жанрам — вот некоторые случаи, когда применимы алгоритмы классификации.
2. Регрессия
Модели регрессии используются, когда существует числовая связь между входными и выходными переменными. Алгоритмы регрессии, которые входят в сферу контролируемого обучения, включают линейную регрессию, нелинейную регрессию, деревья регрессии, полиномиальную регрессию и байесовскую линейную регрессию. Такие модели в основном используются для прогнозирования непрерывных переменных, таких как прогнозирование рыночных тенденций, прогнозирование погоды или предварительное определение рейтинга кликов в онлайн-рекламе в определенное время в течение дня.
Присоединяйтесь к онлайн-курсу по машинному обучению от лучших университетов мира — магистерским программам, программам последипломного образования для руководителей и продвинутой программе сертификации в области машинного обучения и искусственного интеллекта, чтобы ускорить свою карьеру.
3. Нейронные сети
Алгоритмы нейронной сети используются для интерпретации сенсорных данных, распознавания закономерностей или кластеризации необработанных входных данных. Хотя у этого алгоритма есть несколько преимуществ, использование нейронной сети может быть довольно сложным, когда наблюдений слишком много. Популярные реальные приложения нейронных сетей включают извлечение информации, классификацию текста, распознавание речи и символов, обобщение нескольких документов, генерацию языка и многое другое.
4. Наивная байесовская модель
Наивные байесовские классификаторы — это не отдельный алгоритм, а набор алгоритмов, основанных на теореме Байеса. Стандартный принцип, лежащий в основе этих алгоритмов, заключается в том, что каждая пара классифицируемых признаков независима друг от друга. Метки классов назначаются с помощью прямого ациклического графа, состоящего из нескольких дочерних узлов и одного родительского узла. Каждый дочерний узел считается отдельным и независимым от родителя. Популярные реальные приложения наивного байесовского алгоритма включают фильтрацию спама и анализ тональности.
5. Деревья решений
Деревья решений — это модели, похожие на блок-схемы, содержащие операторы условного контроля для сравнения решений и их возможных последствий. Дерево решений представляет собой древовидный граф, в котором внутренние узлы представляют точки, в которых мы выбираем атрибут и задаем вопрос, конечные узлы представляют собой метки классов или фактический результат, а ребра соответствуют ответам на вопросы.
6. Машина опорных векторов
Машина опорных векторов (SVM) основана на теории статистического обучения, предложенной Вэпом Ником, и была разработана еще в 1990 году. Проще говоря, машины опорных векторов представляют собой набор контролируемых методов обучения, используемых для регрессии, классификации и обнаружения выбросов. Они тесно связаны с сетью ядра и находят применение в различных областях, таких как распознавание образов, биоинформатика и поиск мультимедийной информации.
7. Модель случайного леса
Модель случайного леса состоит из ансамбля отдельных деревьев решений, где каждое отдельное дерево дает прогноз класса, а класс с максимальным количеством голосов является прогнозом модели. Идея, лежащая в основе концепции модели случайного леса, заключается в том, что большое количество относительно некоррелированных деревьев или моделей, работающих в ансамбле, будут давать более точные прогнозы, чем любые отдельные прогнозы. Это потому, что деревья защищают друг друга от независимых ошибок.
Как это работает?
Обучение с учителем включает в себя обучение моделей с использованием помеченных наборов данных, чтобы они могли узнать о каждом типе данных. После завершения обучения модели предоставляются тестовые данные для определения и прогнозирования выходных данных.
Давайте рассмотрим простой пример, чтобы прояснить концепцию дальше.
Скажем, вам дали ящик, состоящий из разных видов овощей. В подходе контролируемого машинного обучения ваш первый шаг будет заключаться в том, чтобы познакомить машину со всеми различными овощами один за другим следующим образом:
- Если объект похож на луковицу и пурпурно-розовый, он будет помечен как — Лук.
- Если объект листовой и зеленого цвета, то он будет помечен как «Шпинат».
После того, как вы обучили машину, вы даете ей отдельный овощ из ящика (скажем, лук) и просите идентифицировать его. Теперь, поскольку машина уже узнала об овощах из предыдущих данных, она классифицирует новый объект на основе его формы и цвета и подтвердит результат как луковицу. Таким образом, машина учится или обучается на обучающих данных (ящик с овощами) и применяет эти знания к новым, непредвиденным данным (новый овощ).
Как и в примере с овощами, который мы использовали выше, давайте посмотрим на другой пример контролируемого обучения, чтобы понять, как это работает.
Предположим, у нас есть набор данных, состоящий из различных фигур, таких как треугольники, квадраты и пятиугольники. Первым шагом является обучение модели для каждой фигуры следующим образом:
- Если фигура имеет три стороны, то она будет помечена как – Треугольник.
- Если фигура имеет четыре равные стороны, то она будет помечена как – Квадрат.
- Если фигура имеет пять сторон, то она будет обозначена как — Пятиугольник.
После завершения обучения мы тестируем модель, используя тестовые данные, и задача модели будет заключаться в определении формы на основе знаний об обучении. Следовательно, когда модель находит новую форму, она классифицирует ее на основе количества сторон и выдает результат.
Преимущества и проблемы
Излишне говорить, что контролируемое обучение имеет несколько преимуществ при реализации моделей машинного обучения. Некоторые из его преимуществ перечислены ниже:
- Модели контролируемого обучения могут точно прогнозировать результаты на основе предыдущего опыта.
- Обучение под наблюдением помогает оптимизировать производительность, используя опыт.
- Обучение с учителем дает нам ясное и точное представление о классах объектов.
- И последнее, но не менее важное: алгоритмы обучения с учителем невероятно важны для решения различных реальных проблем и находят применение в различных секторах.
Несомненно, алгоритмы обучения с учителем очень полезны, особенно в отношении их потенциала в решении задач в режиме реального времени. Однако построение устойчивой и эффективной модели обучения с учителем сопряжено с рядом проблем. Итак, давайте посмотрим:
- Весь процесс обучения моделей обучения с учителем занимает много времени.
- Модели контролируемого обучения часто требуют определенного уровня знаний и ресурсов для правильной структуры и функционирования.
- В отличие от моделей обучения без учителя, модели обучения с учителем не могут классифицировать или группировать данные самостоятельно.
- Вероятность появления человеческих ошибок в наборах данных довольно высока, что может привести к неправильному обучению алгоритмов.
Лучшие практики с примерами
Какие передовые методы вы должны иметь в виду, прежде чем рискнуть начать проект с использованием контролируемого машинного обучения? Посмотрите ниже.
- Убедитесь, что вы четко представляете, какие данные вы будете использовать в качестве обучающего набора данных.
- Соберите соответствующие выходные данные либо из стандартных измерений, либо из людей-экспертов.
- Определите структуру алгоритма обучения.
Стоит, наконец, рассказать о некоторых из лучших и самых популярных примеров контролируемого машинного обучения из реальной жизни.
- Прогнозный анализ . Широко распространенный вариант использования моделей обучения с учителем для прогнозного анализа — предоставление значимой и действенной информации о различных точках бизнес-данных. В результате коммерческие предприятия могут предвидеть определенные результаты на основе заданной выходной переменной для обоснования и поддержки решений.
- Распознавание объектов и изображений . Алгоритмы обучения под наблюдением находят применение при обнаружении и классификации объектов на изображениях и видео — частое требование при анализе изображений и различных методах компьютерного зрения.
- Обнаружение спама. Методы обнаружения и фильтрации спама используют контролируемые алгоритмы классификации для обучения баз данных, чтобы они могли распознавать шаблоны в новых данных для эффективного разделения спама и не спама.
- Анализ настроений : отличный способ активизировать усилия по привлечению внимания к бренду — понять взаимодействие с клиентами. В этом отношении может помочь контролируемое машинное обучение, извлекая и классифицируя важную информацию из больших наборов данных, таких как эмоции, намерения, предпочтения клиентов и т. д.
Изучите машинное обучение с upGrad
Хотите добиться успеха в области машинного обучения и искусственного интеллекта? Начните свое путешествие с программы upGrad Executive PG в области машинного обучения и искусственного интеллекта . Это всеобъемлющий сертификационный онлайн-курс, предназначенный для профессионалов, которые хотят освоить востребованные навыки, такие как глубокое обучение, обучение с подкреплением, НЛП и графические модели.
Вот некоторые основные моменты курса, которые вы не можете пропустить:
- Сертификат об окончании курса от IIIT Bangalore.
- Более 450 часов обучения, наполненных живыми занятиями, заданиями по кодированию, примерами из практики и проектами.
- Полный охват 20 инструментов, языков программирования и библиотек.
- Живые уроки кодирования и семинары по созданию профиля.
Заключение
В последнем отчете Technavio об исследовании рынка под названием « Рынок машинного обучения по конечным пользователям и по географии — прогноз и анализ на 2020–2024 годы» прогнозируется, что размер мирового рынка машинного обучения вырастет на 11,16 млрд долларов США в течение прогнозируемого периода 2020–2024 годов. Более того, неуклонное увеличение роста из года в год подпитывает импульс роста рынка.
Как нынешние тенденции, так и прогнозы на будущее указывают на то, что машинное обучение никуда не денется. Алгоритмы обучения с учителем лежат в основе любого проекта машинного обучения, который в основном включает задачи классификации и регрессии. Несмотря на свои проблемы, алгоритмы обучения с учителем наиболее полезны для прогнозирования результатов на основе опыта.