6 tipos de aprendizado supervisionado que você deve conhecer em 2022

Publicados: 2021-01-10

O aprendizado de máquina é uma das aplicações mais comuns da Inteligência Artificial. Uma máquina aprende a executar tarefas a partir dos dados nela alimentados. E com a experiência, seu desempenho em determinada tarefa melhora. O aprendizado de máquina inclui técnicas de aprendizado supervisionado, não supervisionado e reforçado. Leia mais sobre os tipos de aprendizado de máquina.

Neste artigo, veremos diferentes tipos de aprendizado supervisionado.

Índice

O que é Aprendizagem Supervisionada?

No Aprendizado Supervisionado, uma máquina é treinada usando dados 'rotulados'. Os conjuntos de dados são rotulados quando contêm parâmetros de entrada e saída. Em outras palavras, os dados já foram marcados com a resposta correta.

Assim, a técnica imita um ambiente de sala de aula onde um aluno aprende na presença de um supervisor ou professor. Por outro lado, algoritmos de aprendizado não supervisionados permitem que os modelos descubram informações e aprendam por conta própria.

O aprendizado de máquina supervisionado é imensamente útil na resolução de problemas computacionais do mundo real. O algoritmo prevê resultados para dados imprevistos aprendendo com dados de treinamento rotulados. Portanto, são necessários cientistas de dados altamente qualificados para criar e implantar esses modelos. Com o tempo, os cientistas de dados também usam seus conhecimentos técnicos para reconstruir os modelos para manter a integridade dos insights fornecidos.

Como funciona?

Por exemplo, você deseja treinar uma máquina para prever seu tempo de deslocamento entre o escritório e a casa. Primeiro, você criaria um conjunto de dados rotulado, como clima, hora do dia, rota escolhida, etc., que comporia seus dados de entrada. E a saída seria a duração estimada de sua viagem de volta para casa em um dia específico.

Depois de criar um conjunto de treinamento baseado em fatores correspondentes, a máquina veria os relacionamentos entre os pontos de dados e os usaria para determinar quanto tempo levará para você voltar para casa. Por exemplo, um aplicativo móvel pode informar que seu tempo de viagem será maior quando houver chuvas fortes.

A máquina também pode ver outras conexões em seus dados rotulados, como o horário em que você sai do trabalho. Você pode chegar em casa mais cedo se começar antes que o tráfego da hora do rush chegue às estradas. Leia mais se estiver curioso para saber como funciona o aprendizado de máquina não supervisionado.

Agora, vamos tentar entender o aprendizado supervisionado com a ajuda de outro exemplo da vida real. Suponha que você tenha uma cesta de frutas e treine a máquina com todos os tipos de frutas. Os dados de treinamento podem incluir estes cenários:

  • Se o objeto for vermelho, redondo e tiver uma depressão na parte superior, rotule-o como 'Maçã'
  • Se o item tiver uma cor amarelo-esverdeada e o formato de um cilindro curvo, marque-o como 'Banana'

Em seguida, você fornece um novo objeto (dados de teste) e pede à máquina para identificar se é uma banana ou uma maçã. Ele aprenderá com os dados de treinamento e aplicará o conhecimento para classificar a fruta de acordo com as cores e formas inseridas.

Diferentes tipos de Aprendizagem Supervisionada

1. Regressão

Na regressão, um único valor de saída é produzido usando dados de treinamento. Esse valor é uma interpretação probabilística, que é apurada após considerar a força da correlação entre as variáveis ​​de entrada. Por exemplo, a regressão pode ajudar a prever o preço de uma casa com base em sua localidade, tamanho etc.

Na regressão logística, a saída tem valores discretos baseados em um conjunto de variáveis ​​independentes. Esse método pode falhar ao lidar com limites não lineares e de decisão múltipla. Além disso, não é flexível o suficiente para capturar relacionamentos complexos em conjuntos de dados.

2. Classificação

Envolve o agrupamento dos dados em classes. Se você está pensando em conceder crédito a uma pessoa, pode usar a classificação para determinar se uma pessoa seria ou não um inadimplente. Quando o algoritmo de aprendizado supervisionado rotula os dados de entrada em duas classes distintas, ele é chamado de classificação binária. Múltiplas classificações significa categorizar dados em mais de duas classes.

3. Modelo Bayesiano Ingênuo

O modelo Bayesiano de classificação é usado para grandes conjuntos de dados finitos. É um método de atribuição de rótulos de classe usando um gráfico acíclico direto. O gráfico compreende um nó pai e vários nós filhos. E cada nó filho é considerado independente e separado do pai.

Árvores de decisão

Uma árvore de decisão é um modelo semelhante a um fluxograma que contém instruções de controle condicional, incluindo decisões e suas prováveis ​​consequências. A saída refere-se à rotulagem de dados imprevistos.

Na representação em árvore, os nós folha correspondem aos rótulos das classes e os nós internos representam os atributos. Uma árvore de decisão pode ser usada para resolver problemas com atributos discretos, bem como funções booleanas. Alguns dos algoritmos de árvore de decisão notáveis ​​são ID3 e CART.

4. Modelo de Floresta Aleatória

O modelo de floresta aleatória é um método de conjunto. Ele opera construindo uma infinidade de árvores de decisão e gera uma classificação das árvores individuais. Suponha que você queira prever quais alunos de graduação terão um bom desempenho no GMAT – um teste feito para admissão em programas de gestão de pós-graduação. Um modelo de floresta aleatória cumpriria a tarefa, dados os fatores demográficos e educacionais de um conjunto de alunos que fizeram o teste anteriormente.

5. Redes Neurais

Esse algoritmo é projetado para agrupar entradas brutas, reconhecer padrões ou interpretar dados sensoriais. Apesar de suas múltiplas vantagens, as redes neurais requerem recursos computacionais significativos. Pode ser complicado ajustar uma rede neural quando existem milhares de observações. Também é chamado de algoritmo de 'caixa preta', pois interpretar a lógica por trás de suas previsões pode ser um desafio.

Leia : As 10 principais arquiteturas de rede neural em 2020

6. Suporte a Máquinas de Vetor

Support Vector Machine (SVM) é um algoritmo de aprendizado supervisionado desenvolvido no ano de 1990. Ele se baseia na teoria de aprendizado estatístico desenvolvida por Vap Nick.

O SVM separa hiperplanos, o que o torna um classificador discriminativo. A saída é produzida na forma de um hiperplano ótimo que categoriza novos exemplos. Os SVMs estão intimamente ligados à estrutura do kernel e são usados ​​em diversos campos. Alguns exemplos incluem bioinformática, reconhecimento de padrões e recuperação de informações multimídia.

Prós e contras do aprendizado supervisionado

Vários tipos de aprendizado supervisionado permitem coletar e produzir dados de experiências anteriores. Desde a otimização dos critérios de desempenho até o tratamento de problemas do mundo real, o aprendizado supervisionado surgiu como uma ferramenta poderosa no campo da IA. É também um método mais confiável em comparação com o aprendizado não supervisionado, que pode ser computacionalmente complexo e menos preciso em alguns casos.

No entanto, o aprendizado supervisionado não está isento de limitações. Exemplos concretos são necessários para o treinamento de classificadores, e os limites de decisão podem ser supertreinados na ausência dos exemplos corretos. Pode-se também encontrar dificuldade em classificar big data.

Resumindo

A vantagem do aprendizado supervisionado é que ele usa dados rotulados para treinar uma máquina. As técnicas de regressão e algoritmos de classificação ajudam a desenvolver modelos preditivos altamente confiáveis ​​e com múltiplas aplicações.

O aprendizado supervisionado requer especialistas para construir, dimensionar e atualizar modelos. Na ausência de proficiência técnica, força bruta pode ser aplicada para determinar as variáveis ​​de entrada. E isso pode gerar resultados imprecisos. Portanto, a seleção de recursos de dados relevantes é essencial para que o aprendizado supervisionado funcione de maneira eficaz.

Deve-se primeiro decidir quais dados são necessários para o conjunto de treinamento, continuar a estruturar a função e o algoritmo aprendidos e também reunir resultados de especialistas e medições. Essas práticas recomendadas podem ajudar bastante na precisão de um modelo.

À medida que a inteligência artificial e o aprendizado de máquina aceleram no mundo orientado para a tecnologia de hoje, conhecer os tipos de aprendizado supervisionado pode ser um diferencial significativo em qualquer campo. As explicações acima ajudariam você a dar esse primeiro passo!

Se você estiver interessado em aprender mais sobre aprendizado de máquina, confira o PG Diploma in Machine Learning & AI do IIIT-B e upGrad, projetado para profissionais que trabalham e oferece mais de 450 horas de treinamento rigoroso, mais de 30 estudos de caso e atribuições, IIIT- B Status de ex-aluno, mais de 5 projetos práticos práticos e assistência de trabalho com as principais empresas.

Aprenda ML Course das melhores universidades do mundo. Ganhe Masters, Executive PGP ou Advanced Certificate Programs para acelerar sua carreira.

Qual é o significado da aprendizagem supervisionada?

Uma máquina aprende usando dados 'rotulados' no Aprendizado Supervisionado. Quando um conjunto de dados possui parâmetros de entrada e saída, ele é considerado rotulado. Dito de outra forma, a informação já foi rotulada com a resposta correta. Em desafios computacionais do mundo real, o aprendizado de máquina supervisionado é bastante útil. O sistema aprende com dados de treinamento rotulados para prever resultados para dados imprevistos. Como resultado, construir e implantar esses modelos exige a experiência de cientistas de dados altamente qualificados. Os cientistas de dados utilizam seu conhecimento técnico para construir modelos ao longo do tempo, a fim de manter a validade dos insights fornecidos.

Qual é a diferença entre classificação e regressão?

Usando dados de treinamento, a regressão produz um único valor de saída. Esta é uma interpretação probabilística que é determinada levando em conta a força da correlação entre as variáveis ​​de entrada. A regressão, por exemplo, pode ajudar a prever o preço de uma casa com base em sua localização, tamanho e outros fatores. O ato de classificar os dados implica dividi-los em categorias. Você pode usar a categorização para avaliar se uma pessoa deixará de pagar um empréstimo se estiver pensando em oferecer crédito a ela. A classificação binária ocorre quando um algoritmo de aprendizado supervisionado classifica os dados de entrada em duas classes separadas. As classificações múltiplas referem-se à divisão da informação em mais de dois grupos.

O que é uma floresta aleatória?

Um método de conjunto é o modelo de floresta aleatória. Ele funciona criando um grande número de árvores de decisão e classificando as árvores individuais. Digamos que você queira saber quais estudantes universitários se sairão bem no GMAT, um exame necessário para ingressar em programas de pós-graduação em gestão. Dadas as características demográficas e educacionais de um grupo de alunos que fizeram o teste anteriormente, um modelo de floresta aleatória poderia completar a tarefa.