9 ideias e tópicos interessantes de projetos de regressão linear para iniciantes [2022]

Publicados: 2021-01-09

A regressão linear é um tópico popular em aprendizado de máquina. É um algoritmo de aprendizado supervisionado e encontra aplicações em diversos setores. Se você está aprendendo sobre esse tópico e deseja testar suas habilidades, experimente alguns projetos de regressão linear. Neste artigo, estamos discutindo o mesmo.

Temos ideias de projetos de regressão linear para diferentes níveis e domínios de habilidade, para que você possa escolher um de acordo com sua experiência e interesses. Além disso, você pode modificar o nível de desafio de qualquer projeto que mencionamos aqui aumentando (ou diminuindo) os valores de dados adicionados ao seu conjunto de dados.

Participe do Curso de Aprendizado Profundo on-line das principais universidades do mundo - Mestrados, Programas de Pós-Graduação Executiva e Programa de Certificado Avançado em ML e IA para acelerar sua carreira.

Índice

O que é uma regressão linear?

A Regressão Linear é um algoritmo de aprendizado supervisionado em aprendizado de máquina. Ele modela um valor de previsão de acordo com variáveis ​​independentes e ajuda a encontrar a relação entre essas variáveis ​​e a previsão. Os modelos de regressão dependem da relação entre as variáveis ​​independentes e dependentes, bem como do número de variáveis ​​que utilizam.

A regressão linear prevê o valor dependente (y) de acordo com a variável independente (x). A saída aqui é o valor dependente e a entrada é o valor independente. A função de hipótese para regressão linear é a seguinte:

Y = 1 + 2x

O modelo de regressão linear encontra a melhor linha, que prevê o valor de y de acordo com o valor fornecido de x. Para obter a melhor linha, ele encontra os valores mais adequados para 1 e 2 . 1 é o intercepto e 2 é o coeficiente de x. Quando encontramos os melhores valores para 1 e 2 , também encontramos a melhor linha para sua regressão linear.

Agora que discutimos os conceitos básicos de regressão linear, podemos passar para nossas ideias de projeto de regressão linear.

Nossas principais ideias de projetos de regressão linear

Ideia nº 1: orçar uma longa viagem

Suponha que você queira fazer uma longa viagem (de Delhi a Lonawala). Antes de fazer uma viagem tão longa, é melhor preparar um orçamento e descobrir quanto você precisa gastar em uma determinada seção. Você pode usar um modelo de regressão linear aqui para determinar o custo do gás que você terá que obter.

Nesta regressão linear, a quantidade total de dinheiro que você teria que pagar seria a variável dependente, o que significa que seria a saída do nosso modelo. A distância entre os destinos seria a variável independente. Para manter o modelo simples, podemos supor que o preço do combustível permaneceria constante durante a viagem.

Você pode escolher quaisquer dois destinos para este projeto. É uma ótima ideia de projeto para iniciantes porque permite experimentar e entender o conceito com clareza. Além disso, você também pode usar o modelo sempre que planejar uma longa viagem!

Idéia #2: Compare as Taxas de Desemprego com os Ganhos no Mercado de Ações

Se você é um entusiasta da economia ou se deseja usar seu conhecimento de Machine Learning nesse campo, essa é uma das melhores ideias de projeto de regressão linear para você. Todos sabemos como o desemprego é um problema significativo para o nosso país. Neste projeto, encontraríamos a relação entre as taxas de desemprego e os ganhos ocorridos no mercado de ações.

Você pode usar dados oficiais do governo para obter as taxas de desemprego e usá-los para descobrir se há uma relação entre isso e os ganhos no mercado de ações.

Leia: Implementação de regressão linear em Python

Idéia nº 3: Compare os salários dos batedores com a média de corridas que eles marcam por jogo

Cricket é facilmente o jogo mais popular na Índia. Você pode usar seu conhecimento de aprendizado de máquina neste projeto simples, mas empolgante, onde você traçará a relação entre os salários dos batedores e as corridas médias que eles marcam em cada jogo. Nossos jogadores de críquete estão entre alguns dos atletas mais bem pagos do mundo. Trabalhar neste projeto ajudaria você a descobrir o quanto suas médias de rebatidas são responsáveis ​​por seus ganhos.

Se você é iniciante, pode começar com uma equipe e verificar os salários de seus batedores. Por outro lado, se você quiser dar um passo adiante, pode considerar várias equipes (Austrália, Inglaterra, África do Sul, etc.) e verificar os salários de seus batedores também.

Idéia nº 4: Compare as datas em um mês com o salário mensal

Este projeto explora a aplicação do aprendizado de máquina em recursos humanos e gestão. Ele está entre os projetos de regressão linear de nível iniciante, portanto, se você nunca trabalhou em um projeto desse tipo antes, pode começar com este. Aqui, você pega as datas presentes em um mês e compara com o salário mensal.

Depois de estabelecer a relação entre as duas variáveis, você pode explorar se o salário atual é ótimo ou não. Você pode escolher qualquer carreira e encontrar seu salário médio para selecionar como variável independente. Você pode tornar este projeto mais desafiador discutindo muitos outros trabalhos além do original.

Idéia nº 5: Compare as temperaturas globais médias e os níveis de poluição

A poluição e seu impacto sobre o meio ambiente é um tópico de discussão proeminente. A recente pandemia também nos mostrou como ainda podemos salvar nosso meio ambiente. Você também pode usar suas habilidades de aprendizado de máquina nesse campo. Este projeto ajudaria você a entender como o aprendizado de máquina também pode resolver os vários problemas presentes nesse domínio.

Aqui, você pegaria as temperaturas globais médias em vários anos e as compararia com o nível de poluição que aconteceu nesse período. Criar um modelo de regressão linear neste tópico é fácil e não exigiria muito esforço. No entanto, certamente o ajudará a experimentar suas habilidades de aprendizado de máquina.

Idéia nº 6: Compare a temperatura local com a quantidade de chuva

Esta é outra ideia de projeto emocionante para os amantes da natureza e do meio ambiente. Neste projeto, você deve encontrar a relação entre a temperatura local e a quantidade de chuva que ocorre lá. Depois de concluir este projeto, você verá como pode usar a regressão linear e outras técnicas de aprendizado de máquina em Geografia e assuntos relacionados.

Você deve manter a temperatura em Celsius e a quantidade de chuva em mm (milímetros). Para começar, você pode considerar algumas cidades proeminentes do país (como Nova Delhi, Mumbai, Pune, Jaipur) e adicionar mais à medida que concluir o projeto.

Idéia nº 7: Compare a idade média dos humanos com a quantidade de sono

O sono sempre fascinou nossos cientistas. E se você também é fascinado por este tópico, então deveria trabalhar neste. Neste projeto, você deve comparar a expectativa de vida média das pessoas com a quantidade de sono que elas dormem.

Se você deseja entrar no campo da biotecnologia ou neurociência com experiência em aprendizado de máquina, esta é uma excelente opção para você. Isso o ajudaria a explorar as aplicações da regressão linear nesses setores. Existem muitos trabalhos de pesquisa sobre esse tópico, então você não terá problemas para encontrar fontes de dados relevantes.

Idéia #8: Compare a Porcentagem de Sedimentos no Rio com sua Descarga

Esta é outra ideia de projeto empolgante para entusiastas do meio ambiente e da geografia. Aqui, você deve comparar a porcentagem de sedimentos presentes na água com o nível de sua descarga. Você pode começar com um rio e torná-lo mais desafiador adicionando mais córregos. Da mesma forma, você pode começar com um pequeno córrego (ou uma seção de um rio gigante), se nunca trabalhou em projetos de regressão linear antes.

A vazão de um rio é o volume que segue através de seu canal. É o volume total de água que flui através de um determinado ponto, e a unidade para medir a vazão de um rio em metros cúbicos por segundo. Sedimentos são os materiais sólidos presentes em um córrego que se movem e são depositados em um novo local através do rio.

Ideia nº 9: Compare os orçamentos dos filmes indicados ao National Film Awards com o número de filmes que ganharam esses prêmios

Você também aplica regressão linear no setor de entretenimento. Neste projeto, você deve comparar os orçamentos dos filmes indicados ao National Film Awards com o número de filmes que ganharam esses prêmios. Você descobriria se o orçamento de um filme afeta sua probabilidade de ganhar um prêmio ou não. Você pode começar com dados dos últimos cinco anos (2014-19). E se você quiser ir além, poderá adicionar dados de mais anos e tornar o projeto mais desafiador.

Leia também: 15 ideias interessantes de projetos de aprendizado de máquina para iniciantes

Pensamentos finais

Chegamos ao fim da nossa lista de projetos. Esperamos que você tenha achado essas ideias de projetos de regressão linear úteis. Se você tiver alguma dúvida sobre regressão linear ou essas ideias de projeto, sinta-se à vontade para nos perguntar.

Por outro lado, se você quiser saber mais sobre regressão linear, recomendamos acessar nosso blog, onde você encontrará muitos recursos, guias e artigos valiosos sobre esse tópico. Para começar, aqui está nosso guia sobre regressão linear em aprendizado de máquina .

Você pode verificar o Programa PG Executivo do IIT Delhi em Machine Learning em associação com o upGrad . IIT Delhi é uma das instituições de maior prestígio na Índia. Com mais de 500 membros do corpo docente interno que são os melhores nos assuntos.

Quais são os passos importantes a seguir na regressão linear?

Algo mais do que ajustar uma linha linear através de um conjunto de pontos de dados está envolvido na análise de regressão linear. Ele tem três etapas: (1) examinar os dados para correlação e direcionalidade, (2) prever o modelo, ou seja, ajustar a linha, e (3) avaliar a validade e utilidade do modelo. Para começar, use um gráfico de dispersão para avaliar os dados e verificar a direcionalidade e a correlação. Ajustar a linha de regressão é o segundo estágio na análise de regressão. O resíduo inexplicado é minimizado usando estimativa matemática de mínimos quadrados. O teste de significância é a etapa final da análise de regressão linear.

Por que a regressão linear precisa de distribuição normal?

Alguns usuários acreditam erroneamente que a suposição de distribuição normal da regressão linear se aplica aos seus dados. Eles poderiam fazer um histograma de sua variável de resposta para ver se ela se afasta de uma distribuição normal. Outros acreditam que a variável explicativa deve ter uma distribuição regularmente distribuída. Nem é necessário. A suposição de normalidade se aplica às distribuições residuais. Os dados são normalmente distribuídos, assim como a linha de regressão é correspondida aos dados para que a média residual seja zero.

Quais são as vantagens e desvantagens da regressão linear?

O benefício mais significativo da análise de regressão linear é sua linearidade: simplifica o processo de estimativa e, mais importante, essas equações lineares têm uma interpretação modular fácil de entender (ou seja, os pesos). A regressão linear simplesmente considera a média da Variável Dependente. A relação entre a média da variável dependente e as variáveis ​​independentes é estudada por meio de regressão linear. Outliers podem afetar a regressão linear.