Teste do qui quadrado: introdução, como calcular, quando usar

Publicados: 2022-11-09

Em estatística, o teste do qui-quadrado é usado para analisar dados de observações de uma coleção de variáveis ​​normalmente distribuída. Normalmente, isso envolve o contraste de dois conjuntos de informações numéricas. Karl Pearson foi o primeiro a propor este método de análise e distribuição de dados categóricos, dando-lhe o nome de teste do qui-quadrado de Pearson.

O teste do qui-quadrado desenvolvido por Pearson é utilizado em uma tabela de contingência para avaliar se há diferença estatística significativa entre as frequências previstas e reais em uma ou mais das categorias da tabela de qui-quadrado.

Estatisticamente, os estatísticos usam o teste do qui-quadrado para determinar quão bem um modelo se ajusta aos dados. A estatística qui-quadrado precisa de uma amostra de dados variáveis ​​aleatórios, mutuamente exclusivos, brutos e independentes de tamanho suficiente.

Inscreva-se no curso de aprendizado de máquina das melhores universidades do mundo. Ganhe Masters, Executive PGP ou Advanced Certificate Programs para acelerar sua carreira.

Índice

Terminologias básicas do teste de qui-quadrado

A fórmula padrão para calcular um teste qui-quadrado é a soma dos erros quadrados ou falsos positivos divididos pela variância da amostra. Existem alguns termos que são implementados ao usar o teste Qui-quadrado. Esses termos foram definidos abaixo:

valor p

O valor-p é a probabilidade de atingir um qui-quadrado igual ou maior que o do presente experimento, e os dados ainda suportam a hipótese. Essa probabilidade é expressa em porcentagem. Refere-se à probabilidade de que variações antecipadas sejam causadas por nada mais do que ocorrências aleatórias.
Se o valor de p for menor que 0,05, então a hipótese considerada é aceita. Se o valor for superior a 0,05, a hipótese é rejeitada.

Grau de liberdade

Um problema de estimação tem um certo grau de liberdade igual ao número de variáveis ​​independentes. Embora não haja limites rígidos para os valores dessas variáveis, elas impõem limites a outras variáveis ​​se quisermos que nosso conjunto de dados seja consistente com os parâmetros estimados.

Uma definição de “grau de liberdade” é o maior número de valores no conjunto de dados que são logicamente independentes uns dos outros e, portanto, sujeitos a alterações. Deduzir uma do número total de observações em um conjunto de dados produz o grau de liberdade.

Um contexto de destaque em que o conceito de grau de liberdade é abordado é no contexto de testes de hipóteses estatísticas como o qui-quadrado.

Compreender o significado de uma estatística qui-quadrado e a robustez da hipótese nula depende muito do cálculo preciso do grau de liberdade.

Variação

A variância de uma amostra de número aleatório é uma medida de sua dispersão em torno de sua média. É calculado elevando ao quadrado o valor do desvio padrão.

Propriedades para realizar o Teste Qui-quadrado

O teste Qui-quadrado tem as seguintes propriedades:

  • A distribuição média é igual ao número de graus de liberdade.
  • A variância deve ser igual a duas vezes o grau de liberdade.
  • À medida que o grau de liberdade cresce, a curva de distribuição qui-quadrado começa a se assemelhar à curva de distribuição normal, ou seja, uma curva de sino.

Melhores cursos de aprendizado de máquina e cursos de IA on-line

Master of Science em Machine Learning & AI pela LJMU Programa de Pós-Graduação Executiva em Aprendizado de Máquina e IA do IIITB
Programa de Certificado Avançado em Aprendizado de Máquina e PNL do IIITB Programa de Certificação Avançado em Aprendizado de Máquina e Aprendizado Profundo do IIITB Programa Executivo de Pós-Graduação em Ciência de Dados e Aprendizado de Máquina da Universidade de Maryland
Para explorar todos os nossos cursos, visite nossa página abaixo.
Cursos de aprendizado de máquina

Como realizar o Teste Qui-quadrado?

O Qui-quadrado para distribuição é calculado usando a fórmula abaixo:

2 = [(Valor Observado – Valor Esperado ) 2 / Valor Esperado]

Passos a seguir para calcular a estatística Qui-quadrado

  1. Calcule o valor observado e o valor esperado.
  2. Subtraia cada um dos valores esperados do valor observado na tabela de distribuição.
  3. Eleve ao quadrado o valor de cada observação obtida na Etapa 2.
  4. Divida cada um desses valores quadrados por seus valores esperados correspondentes.
  5. A soma de todos os valores obtidos na Etapa 4 fornece um valor que define a estatística do qui-quadrado.
  6. Calcule o grau de liberdade para verificar a satisfação da propriedade dos testes qui-quadrado acima mencionados.

Tipos de Teste Qui-Quadrado

Qualidade de ajuste

Se você quiser ver quão bem uma amostra da população representa o todo, você pode aplicar o teste de ajuste do Qui-quadrado. A população amostral e a população amostral projetada são comparadas usando esta técnica.

Teste para independência

Este teste Qui-quadrado para independência de uma população para determinar se existe uma correlação entre duas variáveis ​​categóricas. O teste independente difere do teste de ajuste, pois não compara um único parâmetro observado com uma população teórica. Em vez disso, o teste de independência compara dois valores dentro de um conjunto de amostras entre si.

Teste de homogeneidade

Assim como o teste de independência, o teste de homogeneidade segue o mesmo formato e procedimento. A distinção crítica entre os dois é que o teste de homogeneidade examina se uma variável tem a mesma distribuição em muitas populações. Em contraste, o teste de independência examina a presença de uma ligação entre duas variáveis ​​categóricas dentro de uma população semelhante.

Quando você deve usar um teste de Qui-quadrado?

O Teste Qui-Quadrado determina se os valores reais são consistentes com as probabilidades teóricas. O Qui-Quadrado é o teste mais confiável a ser usado quando os dados analisados ​​são provenientes de uma amostra aleatória e a variável em questão é categórica.

Habilidades de aprendizado de máquina sob demanda

Cursos de Inteligência Artificial Cursos do Tableau
Cursos de PNL Cursos de Aprendizagem Profunda

Onde é usado o teste do Qui-quadrado?

Tomemos o exemplo de uma empresa de marketing.
Uma empresa de marketing está analisando a correlação entre a geografia do consumidor e as escolhas de marca. Consequentemente, o qui-quadrado desempenha um papel significativo, e o valor da estatística informará como a corporação pode adaptar sua abordagem de marketing em todas as regiões para maximizar as receitas.
Ao analisar os dados, o teste Qui-quadrado é útil para verificar a consistência ou independência das variáveis ​​categóricas, bem como o modelo de ajuste considerado.

Da mesma forma, a estatística do qui-quadrado pode ser usada na profissão médica. O teste do qui-quadrado é adequado para determinar a eficácia de um medicamento em comparação com um grupo controle.

Blogs populares de aprendizado de máquina e inteligência artificial

IoT: História, Presente e Futuro Tutorial de aprendizado de máquina: aprender ML O que é Algoritmo? Simples e fácil
Salário de engenheiro de robótica na Índia: todas as funções Um dia na vida de um engenheiro de aprendizado de máquina: o que eles fazem? O que é IoT (Internet das Coisas)
Permutação vs Combinação: Diferença entre Permutação e Combinação As 7 principais tendências em inteligência artificial e aprendizado de máquina Aprendizado de máquina com R: tudo o que você precisa saber

Conclusão

Neste artigo, você aprendeu sobre as estatísticas do Qui-quadrado e como calcular seus valores. Como o Qui-quadrado trabalha com variáveis ​​categóricas, é frequentemente empregado por acadêmicos que investigam dados de respostas a pesquisas. Essa forma de estudo é comum em muitos campos, incluindo sociologia, psicologia, economia, ciência política e marketing.

Obtenha seu Master of Science em Machine Learning & AI com upGrad

Você está finalmente olhando para atingir um Master of Science? O upGrad colaborou com o IIIT-B e a Liverpool John Moores University para oferecer a você o curso com a maior curadoria possível. Com o Mestrado em Aprendizado de Máquina e IA , você aprenderá todas as habilidades exigidas no campo de ML e IA, como Processamento de Linguagem Natural, Aprendizado Profundo, Aprendizado por Reforço, etc.

Critérios de elegibilidade:

  • Conclusão do bacharelado com 50%
  • Conclusão do Programa Executivo de Pós-Graduação em Machine Learning & AI pelo IIIT-B
  • Uma experiência mínima de trabalho de um ano é o preferido

O que este curso te oferece:

  • Mais de 750 horas de materiais do curso para aprender
  • Projetado para profissionais que trabalham
  • Mais de 15 tarefas e estudos de caso
  • Mais de 12 projetos, dos quais 6 são projetos capstone
  • Aulas de codificação ao vivo
  • Workshops de criação de perfil
  • Bootcamp de carreira
  • Coaching individual de alta performance
  • Sessões individuais de mentoria de carreira
  • Oportunidades de trabalho exclusivas
  • Sessões personalizadas do setor

Como o valor-p está relacionado ao teste Qui-quadrado?

O valor p é a região sob a curva de densidade do qui-quadrado que está à direita do valor da estatística de teste. Se a estatística do teste qui-quadrado é ou não suficientemente grande para rejeitar a hipótese nula é o último passo no teste de significância do qui-quadrado. O valor-p é usado para este propósito.

Existem limitações ou desvantagens no uso do teste Qui-quadrado?

Todos os indivíduos estudados devem ser únicos; caso contrário, os resultados não teriam sentido. Um teste qui-quadrado não deve ser usado se um determinado respondente puder ser classificado em dois grupos distintos. Ainda outra restrição do qui-quadrado é que ele só pode ser usado para dados de frequência. Além disso, a soma de todas as pessoas previstas em todas as classes deve ser maior que 5.

Quais são os pontos fortes do teste Qui-quadrado?

Um de seus principais pontos fortes é que o qui-quadrado pode ser calculado de forma rápida e fácil. Os dados nominais também podem ser utilizados usando este método. Também pode ser usado para comparar mais de dois grupos de variáveis ​​categóricas para significância estatística.