Teste do qui quadrado: introdução, como calcular, quando usar
Publicados: 2022-11-09Em estatística, o teste do qui-quadrado é usado para analisar dados de observações de uma coleção de variáveis normalmente distribuída. Normalmente, isso envolve o contraste de dois conjuntos de informações numéricas. Karl Pearson foi o primeiro a propor este método de análise e distribuição de dados categóricos, dando-lhe o nome de teste do qui-quadrado de Pearson.
O teste do qui-quadrado desenvolvido por Pearson é utilizado em uma tabela de contingência para avaliar se há diferença estatística significativa entre as frequências previstas e reais em uma ou mais das categorias da tabela de qui-quadrado.
Estatisticamente, os estatísticos usam o teste do qui-quadrado para determinar quão bem um modelo se ajusta aos dados. A estatística qui-quadrado precisa de uma amostra de dados variáveis aleatórios, mutuamente exclusivos, brutos e independentes de tamanho suficiente.
Inscreva-se no curso de aprendizado de máquina das melhores universidades do mundo. Ganhe Masters, Executive PGP ou Advanced Certificate Programs para acelerar sua carreira.
Terminologias básicas do teste de qui-quadrado
A fórmula padrão para calcular um teste qui-quadrado é a soma dos erros quadrados ou falsos positivos divididos pela variância da amostra. Existem alguns termos que são implementados ao usar o teste Qui-quadrado. Esses termos foram definidos abaixo:
valor p
O valor-p é a probabilidade de atingir um qui-quadrado igual ou maior que o do presente experimento, e os dados ainda suportam a hipótese. Essa probabilidade é expressa em porcentagem. Refere-se à probabilidade de que variações antecipadas sejam causadas por nada mais do que ocorrências aleatórias.
Se o valor de p for menor que 0,05, então a hipótese considerada é aceita. Se o valor for superior a 0,05, a hipótese é rejeitada.
Grau de liberdade
Um problema de estimação tem um certo grau de liberdade igual ao número de variáveis independentes. Embora não haja limites rígidos para os valores dessas variáveis, elas impõem limites a outras variáveis se quisermos que nosso conjunto de dados seja consistente com os parâmetros estimados.
Uma definição de “grau de liberdade” é o maior número de valores no conjunto de dados que são logicamente independentes uns dos outros e, portanto, sujeitos a alterações. Deduzir uma do número total de observações em um conjunto de dados produz o grau de liberdade.
Um contexto de destaque em que o conceito de grau de liberdade é abordado é no contexto de testes de hipóteses estatísticas como o qui-quadrado.
Compreender o significado de uma estatística qui-quadrado e a robustez da hipótese nula depende muito do cálculo preciso do grau de liberdade.
Variação
A variância de uma amostra de número aleatório é uma medida de sua dispersão em torno de sua média. É calculado elevando ao quadrado o valor do desvio padrão.
Propriedades para realizar o Teste Qui-quadrado
O teste Qui-quadrado tem as seguintes propriedades:
- A distribuição média é igual ao número de graus de liberdade.
- A variância deve ser igual a duas vezes o grau de liberdade.
- À medida que o grau de liberdade cresce, a curva de distribuição qui-quadrado começa a se assemelhar à curva de distribuição normal, ou seja, uma curva de sino.
Melhores cursos de aprendizado de máquina e cursos de IA on-line
Master of Science em Machine Learning & AI pela LJMU | Programa de Pós-Graduação Executiva em Aprendizado de Máquina e IA do IIITB | |
Programa de Certificado Avançado em Aprendizado de Máquina e PNL do IIITB | Programa de Certificação Avançado em Aprendizado de Máquina e Aprendizado Profundo do IIITB | Programa Executivo de Pós-Graduação em Ciência de Dados e Aprendizado de Máquina da Universidade de Maryland |
Para explorar todos os nossos cursos, visite nossa página abaixo. | ||
Cursos de aprendizado de máquina |
Como realizar o Teste Qui-quadrado?
O Qui-quadrado para distribuição é calculado usando a fórmula abaixo:
2 = [(Valor Observado – Valor Esperado ) 2 / Valor Esperado]
Passos a seguir para calcular a estatística Qui-quadrado
- Calcule o valor observado e o valor esperado.
- Subtraia cada um dos valores esperados do valor observado na tabela de distribuição.
- Eleve ao quadrado o valor de cada observação obtida na Etapa 2.
- Divida cada um desses valores quadrados por seus valores esperados correspondentes.
- A soma de todos os valores obtidos na Etapa 4 fornece um valor que define a estatística do qui-quadrado.
- Calcule o grau de liberdade para verificar a satisfação da propriedade dos testes qui-quadrado acima mencionados.
Tipos de Teste Qui-Quadrado
Qualidade de ajuste
Se você quiser ver quão bem uma amostra da população representa o todo, você pode aplicar o teste de ajuste do Qui-quadrado. A população amostral e a população amostral projetada são comparadas usando esta técnica.
Teste para independência
Este teste Qui-quadrado para independência de uma população para determinar se existe uma correlação entre duas variáveis categóricas. O teste independente difere do teste de ajuste, pois não compara um único parâmetro observado com uma população teórica. Em vez disso, o teste de independência compara dois valores dentro de um conjunto de amostras entre si.
Teste de homogeneidade
Assim como o teste de independência, o teste de homogeneidade segue o mesmo formato e procedimento. A distinção crítica entre os dois é que o teste de homogeneidade examina se uma variável tem a mesma distribuição em muitas populações. Em contraste, o teste de independência examina a presença de uma ligação entre duas variáveis categóricas dentro de uma população semelhante.
Quando você deve usar um teste de Qui-quadrado?
O Teste Qui-Quadrado determina se os valores reais são consistentes com as probabilidades teóricas. O Qui-Quadrado é o teste mais confiável a ser usado quando os dados analisados são provenientes de uma amostra aleatória e a variável em questão é categórica.
Habilidades de aprendizado de máquina sob demanda
Cursos de Inteligência Artificial | Cursos do Tableau |
Cursos de PNL | Cursos de Aprendizagem Profunda |
Onde é usado o teste do Qui-quadrado?
Tomemos o exemplo de uma empresa de marketing.
Uma empresa de marketing está analisando a correlação entre a geografia do consumidor e as escolhas de marca. Consequentemente, o qui-quadrado desempenha um papel significativo, e o valor da estatística informará como a corporação pode adaptar sua abordagem de marketing em todas as regiões para maximizar as receitas.
Ao analisar os dados, o teste Qui-quadrado é útil para verificar a consistência ou independência das variáveis categóricas, bem como o modelo de ajuste considerado.
Da mesma forma, a estatística do qui-quadrado pode ser usada na profissão médica. O teste do qui-quadrado é adequado para determinar a eficácia de um medicamento em comparação com um grupo controle.
Blogs populares de aprendizado de máquina e inteligência artificial
IoT: História, Presente e Futuro | Tutorial de aprendizado de máquina: aprender ML | O que é Algoritmo? Simples e fácil |
Salário de engenheiro de robótica na Índia: todas as funções | Um dia na vida de um engenheiro de aprendizado de máquina: o que eles fazem? | O que é IoT (Internet das Coisas) |
Permutação vs Combinação: Diferença entre Permutação e Combinação | As 7 principais tendências em inteligência artificial e aprendizado de máquina | Aprendizado de máquina com R: tudo o que você precisa saber |
Conclusão
Neste artigo, você aprendeu sobre as estatísticas do Qui-quadrado e como calcular seus valores. Como o Qui-quadrado trabalha com variáveis categóricas, é frequentemente empregado por acadêmicos que investigam dados de respostas a pesquisas. Essa forma de estudo é comum em muitos campos, incluindo sociologia, psicologia, economia, ciência política e marketing.
Obtenha seu Master of Science em Machine Learning & AI com upGrad
Você está finalmente olhando para atingir um Master of Science? O upGrad colaborou com o IIIT-B e a Liverpool John Moores University para oferecer a você o curso com a maior curadoria possível. Com o Mestrado em Aprendizado de Máquina e IA , você aprenderá todas as habilidades exigidas no campo de ML e IA, como Processamento de Linguagem Natural, Aprendizado Profundo, Aprendizado por Reforço, etc.
Critérios de elegibilidade:
- Conclusão do bacharelado com 50%
- Conclusão do Programa Executivo de Pós-Graduação em Machine Learning & AI pelo IIIT-B
- Uma experiência mínima de trabalho de um ano é o preferido
O que este curso te oferece:
- Mais de 750 horas de materiais do curso para aprender
- Projetado para profissionais que trabalham
- Mais de 15 tarefas e estudos de caso
- Mais de 12 projetos, dos quais 6 são projetos capstone
- Aulas de codificação ao vivo
- Workshops de criação de perfil
- Bootcamp de carreira
- Coaching individual de alta performance
- Sessões individuais de mentoria de carreira
- Oportunidades de trabalho exclusivas
- Sessões personalizadas do setor
Como o valor-p está relacionado ao teste Qui-quadrado?
O valor p é a região sob a curva de densidade do qui-quadrado que está à direita do valor da estatística de teste. Se a estatística do teste qui-quadrado é ou não suficientemente grande para rejeitar a hipótese nula é o último passo no teste de significância do qui-quadrado. O valor-p é usado para este propósito.
Existem limitações ou desvantagens no uso do teste Qui-quadrado?
Todos os indivíduos estudados devem ser únicos; caso contrário, os resultados não teriam sentido. Um teste qui-quadrado não deve ser usado se um determinado respondente puder ser classificado em dois grupos distintos. Ainda outra restrição do qui-quadrado é que ele só pode ser usado para dados de frequência. Além disso, a soma de todas as pessoas previstas em todas as classes deve ser maior que 5.
Quais são os pontos fortes do teste Qui-quadrado?
Um de seus principais pontos fortes é que o qui-quadrado pode ser calculado de forma rápida e fácil. Os dados nominais também podem ser utilizados usando este método. Também pode ser usado para comparar mais de dois grupos de variáveis categóricas para significância estatística.