Diferentes tipos de modelos de regressão que você precisa conhecer
Publicados: 2022-01-07Problemas de regressão são comuns no aprendizado de máquina, e a técnica mais comum para resolvê-los é a análise de regressão. Baseia-se na modelagem de dados e envolve a definição da linha de melhor ajuste, que passa por todos os pontos de dados para que a distância entre a linha e cada ponto de dados seja mínima. Embora existam muitas técnicas diferentes de análise de regressão, a regressão linear e a logística são as mais proeminentes. O tipo de modelo de análise de regressão que usamos eventualmente dependerá da natureza dos dados envolvidos.
Vamos descobrir mais sobre a análise de regressão e os diferentes tipos de modelos de análise de regressão.
Índice
O que é Análise de Regressão?
A análise de regressão é uma técnica de modelagem preditiva para determinar a relação entre as variáveis dependentes (alvo) e as variáveis independentes em um conjunto de dados. Normalmente é usado quando a variável de destino contém valores contínuos e as variáveis dependentes e independentes compartilham um relacionamento linear ou não linear. Assim, as técnicas de análise de regressão são úteis para determinar a relação de efeito causal entre variáveis, modelagem de séries temporais e previsão. Por exemplo, a relação entre as vendas e os gastos com propaganda de uma empresa pode ser melhor estudada usando a análise de regressão.
Tipos de Análise de Regressão
Existem muitos tipos diferentes de técnicas de análise de regressão que podemos usar para fazer previsões. Além disso, o uso de cada técnica é orientado por fatores como o número de variáveis independentes, a forma da linha de regressão e o tipo de variável dependente.
Vamos entender alguns dos métodos de análise de regressão mais usados:
1. Regressão Linear
A regressão linear é a técnica de modelagem mais conhecida e assume uma relação linear entre uma variável dependente (Y) e uma variável independente (X). Ele estabelece essa relação linear usando uma linha de regressão, também conhecida como linha de melhor ajuste. A relação linear é representada pela equação Y = c+m*X + e, onde 'c' é a interceptação, 'm' é a inclinação da linha e 'e' é o termo de erro.
O modelo de regressão linear pode ser simples (com uma variável dependente e uma independente) ou múltipla (com uma variável dependente e mais de uma variável independente).
Fonte
2. Regressão Logística
A técnica de análise de regressão logística encontra uso quando a variável dependente é discreta. Em outras palavras, esta técnica é usada para estimar a probabilidade de eventos mutuamente exclusivos como passa/falha, verdadeiro/falso, 0/1, etc. Assim, a variável alvo pode ter apenas um de dois valores, e uma curva sigmóide representa sua relação com a variável independente. O valor da probabilidade varia entre 0 e 1.
Fonte
3. Regressão Polinomial
A técnica de análise de regressão polinomial modela uma relação não linear entre as variáveis dependentes e independentes. É uma forma modificada do modelo de regressão linear múltipla, mas a linha de melhor ajuste que passa por todos os pontos de dados é curva e não reta.
Fonte
4. Regressão do cume
A técnica de análise de regressão de crista é utilizada quando os dados apresentam multicolinearidade; ou seja, as variáveis independentes são altamente correlacionadas. Embora as estimativas de mínimos quadrados em multicolinearidade sejam imparciais, suas variâncias são grandes o suficiente para desviar o valor observado do valor verdadeiro. A regressão de cume minimiza os erros padrão ao introduzir um grau de viés nas estimativas de regressão.
O lambda (λ) na equação de regressão da crista resolve o problema da multicolinearidade.
Fonte
Fonte
5. Regressão do Laço
Assim como a regressão ridge, a técnica de regressão lasso (Least Absolute Shrinkage and Selection Operator) penaliza o tamanho absoluto do coeficiente de regressão. Além disso, a técnica de regressão de laço usa seleção de variáveis, o que resulta em valores de coeficiente encolhendo em direção ao zero absoluto.
Fonte
6. Regressão Quantílica
A técnica de análise de regressão quantílica é uma extensão da análise de regressão linear. É usado quando as condições de regressão linear não são atendidas ou os dados apresentam valores discrepantes. A regressão quantílica encontra aplicações em estatística e econometria.
Fonte
7. Regressão Linear Bayesiana
A regressão linear Bayesiana é um dos tipos de técnicas de análise de regressão em aprendizado de máquina que utiliza o teorema de Bayes para determinar o valor dos coeficientes de regressão. Em vez de descobrir os mínimos quadrados, esta técnica determina a distribuição posterior dos recursos. Como resultado, a técnica tem mais estabilidade do que a regressão linear simples.
Fonte
8. Regressão dos Componentes Principais
A técnica de regressão de componentes principais é normalmente usada para analisar dados de regressão múltipla com multicolinearidade. Assim como a técnica de regressão de crista, o método de regressão de componentes principais minimiza os erros padrão ao conferir um grau de viés às estimativas de regressão. A técnica tem duas etapas – primeiro, a análise de componentes principais é aplicada aos dados de treinamento e, em seguida, as amostras transformadas são usadas para treinar um regressor.
9. Regressão Parcial dos Mínimos Quadrados
A técnica de regressão de mínimos quadrados parciais é um dos tipos rápidos e eficientes de técnicas de análise de regressão baseadas em covariância. É benéfico para problemas de regressão onde o número de variáveis independentes é alto com provável multicolinearidade entre as variáveis. A técnica reduz as variáveis a um conjunto menor de preditores, que são então usados para realizar uma regressão.
10. Regressão Líquida Elástica
A técnica de regressão de rede elástica é um híbrido dos modelos de regressão ridge e lasso e é útil ao lidar com variáveis altamente correlacionadas. Ele usa as penalidades dos métodos de regressão ridge e lasso para regularizar os modelos de regressão.
Fonte
Resumo
Além das técnicas de análise de regressão discutidas aqui, vários outros tipos de modelos de regressão são usados no aprendizado de máquina, como regressão ecológica, regressão passo a passo, regressão jackknife e regressão robusta. O caso de uso específico de todos esses diferentes tipos de técnicas de regressão depende da natureza dos dados disponíveis e do nível de precisão que pode ser alcançado. No geral, a análise de regressão tem dois benefícios principais. Estes são os seguintes:
- Indica a relação entre uma variável dependente e uma variável independente.
- Mostra a força do impacto de variáveis independentes em uma variável dependente.
Caminho a seguir: obtenha um mestrado em ciências em aprendizado de máquina e IA
Você está procurando um programa on-line abrangente para se preparar para uma carreira de aprendizado de máquina e inteligência artificial?
O upGrad oferece um Mestrado em Aprendizado de Máquina e IA em associação com a Liverpool John Moores University e o IIIT Bangalore para produzir profissionais versáteis de IA e Cientistas de Dados.
O abrangente programa on-line de 20 meses é projetado especificamente para profissionais que desejam dominar conceitos e habilidades avançadas como Deep Learning, PNL, Modelos Gráficos, Aprendizado por Reforço e similares. Além disso, o programa pretende transmitir uma base sólida em estatística, juntamente com as principais linguagens e ferramentas de programação, como Python, Keras, TensorFlow, Kubernetes, MySQL e muito mais.
Destaques do programa:
- Mestrado pela Liverpool John Moores University
- PGP Executivo do IIIT Bangalore
- Mais de 40 sessões ao vivo, mais de 12 estudos de caso e projetos, 11 tarefas de codificação, seis projetos fundamentais
- Mais de 25 sessões de orientação com especialistas do setor
- Assistência de carreira 360 graus e suporte ao aprendizado
- Oportunidades de networking peer-to-peer
Com um corpo docente de classe mundial, pedagogia, tecnologia e especialistas do setor, o upGrad emergiu como a maior plataforma de EdTech do sul da Ásia e impactou mais de 500.000 profissionais em todo o mundo. Inscreva-se hoje para se tornar parte da base global de mais de 40.000 alunos do upGrad em mais de 80 países!
1. O que é definição de teste de regressão?
O teste de regressão é definido como um tipo de teste de software feito para verificar se uma alteração de código no software não teve impacto na funcionalidade do produto existente. Ele garante que o produto tenha um bom desempenho com as novas funcionalidades ou quaisquer alterações nos recursos existentes. O teste de regressão envolve uma seleção parcial ou completa de casos de teste executados anteriormente que são reexecutados para verificar as condições de funcionamento das funcionalidades existentes.
Qual é o propósito de um modelo de regressão?
A análise de regressão é feita para um de dois propósitos - para prever o valor da variável dependente onde alguma informação sobre as variáveis independentes está disponível ou para prever o efeito de uma variável independente em uma variável dependente.
A análise de regressão é feita para um de dois propósitos - para prever o valor da variável dependente onde alguma informação sobre as variáveis independentes está disponível ou para prever o efeito de uma variável independente em uma variável dependente.
Um tamanho de amostra adequado é essencial para garantir a precisão e validade dos resultados. Embora não exista uma regra prática para determinar o tamanho adequado da amostra na análise de regressão, alguns pesquisadores consideram pelo menos dez observações por variável. Assim, se usarmos três variáveis independentes, o tamanho mínimo da amostra seria 30. Muitos pesquisadores também seguem uma fórmula estatística para determinar o tamanho da amostra.