O que são intervalos de confiança nas estatísticas?

intervalos de confiança

A estatística é uma espécie de mistura entre matemática e probabilidade. O objetivo das estatísticas é descrever processos que você pode observar no mundo – a altura dos carvalhos ou a probabilidade de uma vacina funcionar para afastar doenças – sem ter que medir todos os carvalhos do mundo ou vacinar todas as pessoas antes de decidir como. eficaz é um medicamento.

Como a probabilidade descreve coisas que envolvem o acaso, temos que aceitar que, qualquer que seja o processo que utilizamos para medir as estatísticas, nunca obteremos o quadro completo.

Conteúdo

  1. Por que usar estatísticas?
  2. Intervalos de confiança
  3. Os limites das estatísticas

Por que usar estatísticas?

Suponha que você jogue uma moeda quatro vezes. Você obtém três caras e uma cauda. Sem usar estatísticas, poderíamos concluir que a probabilidade de obter cara é de 75 por cento, onde a probabilidade real de obter cara num lançamento de moeda é de 1:1, ou uma probabilidade de 50-50. Se, em vez disso, fizéssemos 40 lançamentos de moeda, certamente chegaríamos muito mais perto de uma proporção de 1:1 de cara para coroa, e o uso de estatísticas refletiria isso.

“Grande parte das estatísticas tem a ver com o raciocínio desde uma amostra – as observações reais – até às características da população – todas as observações possíveis”, diz John Drake, professor pesquisador do Centro de Ecologia de Doenças Infecciosas da Universidade da Geórgia , em um e-mail. “Por exemplo, podemos estar interessados ​​na altura dos carvalhos. Não podemos medir todos os carvalhos do mundo, mas podemos medir alguns. Podemos calcular a altura média dos carvalhos na amostra, mas isto ganhou”. não será necessariamente igual à média de todos os carvalhos.”

Intervalos de confiança

Como não podemos medir todos os carvalhos do mundo, os estatísticos apresentam um intervalo estimado de alturas com base na probabilidade e em todos os dados à sua disposição. Esse intervalo é chamado de intervalo de confiança e consiste em dois números: um que provavelmente é menor que o valor verdadeiro e outro que provavelmente é maior. O verdadeiro valor provavelmente está em algum lugar no meio.”Um ‘intervalo de confiança de 95 por cento’ significa que 95 em cada 100 vezes que o intervalo de confiança é construído desta forma, o intervalo incluirá o valor verdadeiro”, diz Drake. “Se medissemos amostras de carvalhos 100 vezes, o intervalo de confiança baseado nos dados coletados em 95 desses experimentos incluiria a média da população, ou a altura média de todos os carvalhos. Assim, um intervalo de confiança é uma medida da precisão de uma estimativa. A estimativa fica cada vez mais precisa à medida que você coleta mais dados. É por isso que os intervalos de confiança ficam menores à medida que mais dados ficam disponíveis.”

Portanto, um intervalo de confiança ajuda a mostrar quão boa ou ruim é a estimativa. Quando lançamos uma moeda apenas quatro vezes, a nossa estimativa de 75% tem um amplo intervalo de confiança porque o tamanho da nossa amostra é muito pequeno. Nossa estimativa com 40 lançamentos de moeda teria um intervalo de confiança muito mais estreito.

O verdadeiro significado de um intervalo de confiança tem a ver com a repetição de um experimento indefinidamente. No caso dos quatro lançamentos de moeda, um intervalo de confiança de 95 por cento significa que se repetirmos a experiência de lançamento de moeda 100 vezes, em 95 delas, a nossa probabilidade de obter cara ficará dentro desse intervalo de confiança.

Os limites das estatísticas

Existem limites para as estatísticas. Você tem que elaborar um bom estudo – as estatísticas não podem dizer nada que você não tenha perguntado.

Digamos que você esteja estudando a eficácia de uma vacina, mas não incluiu crianças no estudo. Você pode chegar a um intervalo de confiança com base nos dados coletados, mas isso não dirá nada sobre o quão bem a vacina protege as crianças.

“Além de ter dados suficientes, a amostra também precisa ser representativa”, afirma Drake. “Normalmente, isto significa ter uma amostra aleatória ou uma amostra aleatória estratificada. Supondo que os 1.000 participantes no seu hipotético ensaio de vacina sejam representativos da população, então é razoável concluir que a verdadeira eficácia da vacina está dentro do intervalo de confiança relatado. Se a amostra não for representativa – se não incluir crianças – então não há base estatística para tirar conclusões sobre a parte não representada da população”.

Agora isso é interessante:

Florence Nightingale foi uma das estatísticas mais importantes da história, usando a ciência em que foi pioneira para salvar vidas de soldados durante a Guerra da Crimeia.

Pai, marido, analista de sistemas, web master, proprietário de agência de marketing digital e apaixonado pelo que faz. Desde 2011 escrevendo artigos e conteúdos para web com foco em tecnologia,