Diferentes tipos de modelos de regressão que você precisa conhecer

Publicados: 2022-01-07

Problemas de regressão são comuns no aprendizado de máquina, e a técnica mais comum para resolvê-los é a análise de regressão. Baseia-se na modelagem de dados e envolve a definição da linha de melhor ajuste, que passa por todos os pontos de dados para que a distância entre a linha e cada ponto de dados seja mínima. Embora existam muitas técnicas diferentes de análise de regressão, a regressão linear e a logística são as mais proeminentes. O tipo de modelo de análise de regressão que usamos eventualmente dependerá da natureza dos dados envolvidos.

Vamos descobrir mais sobre a análise de regressão e os diferentes tipos de modelos de análise de regressão.

Índice

O que é Análise de Regressão?

A análise de regressão é uma técnica de modelagem preditiva para determinar a relação entre as variáveis ​​dependentes (alvo) e as variáveis ​​independentes em um conjunto de dados. Normalmente é usado quando a variável de destino contém valores contínuos e as variáveis ​​dependentes e independentes compartilham um relacionamento linear ou não linear. Assim, as técnicas de análise de regressão são úteis para determinar a relação de efeito causal entre variáveis, modelagem de séries temporais e previsão. Por exemplo, a relação entre as vendas e os gastos com propaganda de uma empresa pode ser melhor estudada usando a análise de regressão.

Tipos de Análise de Regressão

Existem muitos tipos diferentes de técnicas de análise de regressão que podemos usar para fazer previsões. Além disso, o uso de cada técnica é orientado por fatores como o número de variáveis ​​independentes, a forma da linha de regressão e o tipo de variável dependente.

Vamos entender alguns dos métodos de análise de regressão mais usados:

1. Regressão Linear

A regressão linear é a técnica de modelagem mais conhecida e assume uma relação linear entre uma variável dependente (Y) e uma variável independente (X). Ele estabelece essa relação linear usando uma linha de regressão, também conhecida como linha de melhor ajuste. A relação linear é representada pela equação Y = c+m*X + e, onde 'c' é a interceptação, 'm' é a inclinação da linha e 'e' é o termo de erro.

O modelo de regressão linear pode ser simples (com uma variável dependente e uma independente) ou múltipla (com uma variável dependente e mais de uma variável independente).

Fonte

2. Regressão Logística

A técnica de análise de regressão logística encontra uso quando a variável dependente é discreta. Em outras palavras, esta técnica é usada para estimar a probabilidade de eventos mutuamente exclusivos como passa/falha, verdadeiro/falso, 0/1, etc. Assim, a variável alvo pode ter apenas um de dois valores, e uma curva sigmóide representa sua relação com a variável independente. O valor da probabilidade varia entre 0 e 1.

Fonte

3. Regressão Polinomial

A técnica de análise de regressão polinomial modela uma relação não linear entre as variáveis ​​dependentes e independentes. É uma forma modificada do modelo de regressão linear múltipla, mas a linha de melhor ajuste que passa por todos os pontos de dados é curva e não reta.

Fonte

4. Regressão do cume

A técnica de análise de regressão de crista é utilizada quando os dados apresentam multicolinearidade; ou seja, as variáveis ​​independentes são altamente correlacionadas. Embora as estimativas de mínimos quadrados em multicolinearidade sejam imparciais, suas variâncias são grandes o suficiente para desviar o valor observado do valor verdadeiro. A regressão de cume minimiza os erros padrão ao introduzir um grau de viés nas estimativas de regressão.

O lambda (λ) na equação de regressão da crista resolve o problema da multicolinearidade.

Fonte

Fonte

5. Regressão do Laço

Assim como a regressão ridge, a técnica de regressão lasso (Least Absolute Shrinkage and Selection Operator) penaliza o tamanho absoluto do coeficiente de regressão. Além disso, a técnica de regressão de laço usa seleção de variáveis, o que resulta em valores de coeficiente encolhendo em direção ao zero absoluto.

Fonte

6. Regressão Quantílica

A técnica de análise de regressão quantílica é uma extensão da análise de regressão linear. É usado quando as condições de regressão linear não são atendidas ou os dados apresentam valores discrepantes. A regressão quantílica encontra aplicações em estatística e econometria.

Fonte

7. Regressão Linear Bayesiana

A regressão linear Bayesiana é um dos tipos de técnicas de análise de regressão em aprendizado de máquina que utiliza o teorema de Bayes para determinar o valor dos coeficientes de regressão. Em vez de descobrir os mínimos quadrados, esta técnica determina a distribuição posterior dos recursos. Como resultado, a técnica tem mais estabilidade do que a regressão linear simples.

Fonte

8. Regressão dos Componentes Principais

A técnica de regressão de componentes principais é normalmente usada para analisar dados de regressão múltipla com multicolinearidade. Assim como a técnica de regressão de crista, o método de regressão de componentes principais minimiza os erros padrão ao conferir um grau de viés às estimativas de regressão. A técnica tem duas etapas – primeiro, a análise de componentes principais é aplicada aos dados de treinamento e, em seguida, as amostras transformadas são usadas para treinar um regressor.

9. Regressão Parcial dos Mínimos Quadrados

A técnica de regressão de mínimos quadrados parciais é um dos tipos rápidos e eficientes de técnicas de análise de regressão baseadas em covariância. É benéfico para problemas de regressão onde o número de variáveis ​​independentes é alto com provável multicolinearidade entre as variáveis. A técnica reduz as variáveis ​​a um conjunto menor de preditores, que são então usados ​​para realizar uma regressão.

10. Regressão Líquida Elástica

A técnica de regressão de rede elástica é um híbrido dos modelos de regressão ridge e lasso e é útil ao lidar com variáveis ​​altamente correlacionadas. Ele usa as penalidades dos métodos de regressão ridge e lasso para regularizar os modelos de regressão.

Fonte

Resumo

Além das técnicas de análise de regressão discutidas aqui, vários outros tipos de modelos de regressão são usados ​​no aprendizado de máquina, como regressão ecológica, regressão passo a passo, regressão jackknife e regressão robusta. O caso de uso específico de todos esses diferentes tipos de técnicas de regressão depende da natureza dos dados disponíveis e do nível de precisão que pode ser alcançado. No geral, a análise de regressão tem dois benefícios principais. Estes são os seguintes:

  • Indica a relação entre uma variável dependente e uma variável independente.
  • Mostra a força do impacto de variáveis ​​independentes em uma variável dependente.

Caminho a seguir: obtenha um mestrado em ciências em aprendizado de máquina e IA

Você está procurando um programa on-line abrangente para se preparar para uma carreira de aprendizado de máquina e inteligência artificial?

O upGrad oferece um Mestrado em Aprendizado de Máquina e IA em associação com a Liverpool John Moores University e o IIIT Bangalore para produzir profissionais versáteis de IA e Cientistas de Dados.

O abrangente programa on-line de 20 meses é projetado especificamente para profissionais que desejam dominar conceitos e habilidades avançadas como Deep Learning, PNL, Modelos Gráficos, Aprendizado por Reforço e similares. Além disso, o programa pretende transmitir uma base sólida em estatística, juntamente com as principais linguagens e ferramentas de programação, como Python, Keras, TensorFlow, Kubernetes, MySQL e muito mais.

Destaques do programa:

  • Mestrado pela Liverpool John Moores University
  • PGP Executivo do IIIT Bangalore
  • Mais de 40 sessões ao vivo, mais de 12 estudos de caso e projetos, 11 tarefas de codificação, seis projetos fundamentais
  • Mais de 25 sessões de orientação com especialistas do setor
  • Assistência de carreira 360 graus e suporte ao aprendizado
  • Oportunidades de networking peer-to-peer

Com um corpo docente de classe mundial, pedagogia, tecnologia e especialistas do setor, o upGrad emergiu como a maior plataforma de EdTech do sul da Ásia e impactou mais de 500.000 profissionais em todo o mundo. Inscreva-se hoje para se tornar parte da base global de mais de 40.000 alunos do upGrad em mais de 80 países!

1. O que é definição de teste de regressão?

O teste de regressão é definido como um tipo de teste de software feito para verificar se uma alteração de código no software não teve impacto na funcionalidade do produto existente. Ele garante que o produto tenha um bom desempenho com as novas funcionalidades ou quaisquer alterações nos recursos existentes. O teste de regressão envolve uma seleção parcial ou completa de casos de teste executados anteriormente que são reexecutados para verificar as condições de funcionamento das funcionalidades existentes.

Qual é o propósito de um modelo de regressão?

A análise de regressão é feita para um de dois propósitos - para prever o valor da variável dependente onde alguma informação sobre as variáveis ​​independentes está disponível ou para prever o efeito de uma variável independente em uma variável dependente.

A análise de regressão é feita para um de dois propósitos - para prever o valor da variável dependente onde alguma informação sobre as variáveis ​​independentes está disponível ou para prever o efeito de uma variável independente em uma variável dependente.

Um tamanho de amostra adequado é essencial para garantir a precisão e validade dos resultados. Embora não exista uma regra prática para determinar o tamanho adequado da amostra na análise de regressão, alguns pesquisadores consideram pelo menos dez observações por variável. Assim, se usarmos três variáveis ​​independentes, o tamanho mínimo da amostra seria 30. Muitos pesquisadores também seguem uma fórmula estatística para determinar o tamanho da amostra.