Home EstudosSala de AulaMatemática Probabilidade: 1. O que é a Estatística

Probabilidade: 1. O que é a Estatística

by Lucas Gomes

Estatística é a ciência das probabilidades, o conjunto de regras matemáticas que permite fazer previsões sobre determinado universo estudado, a partir de uma amostragem significativa. Uma apresentação como essa tende a reforçar a idéia de que estatística é uma espécie de álgebra burocrática, cujas fórmulas incompreensíveis são utilizadas para defender conclusões suspeitas.

Esse preconceito contra a estatística não vem de agora. Benjamin Disraeli, político britânico do século 19, dizia que há “mentiras, mentiras deslavadas e estatísticas”.

Uma piada diz que se uma pessoa come dois frangos e outra nenhum, não há qualquer problema, pois, estatisticamente, elas comem um frango cada.

Essa é uma conclusão fácil para quem resume a estatística ao cálculo da média aritmética. Se nos aprofundarmos, porém, em alguns de seus conceitos e ferramentas básicas, que utilizam cálculos aritméticos simples, verificaremos que os cenários projetados pela estatística são mais confiáveis do que sugerem as ironias divertidas, mas um tanto rasas, que lhe são dirigidas.


Representação gráfica com porcentagens.
Nota-se que o total das partes dá 100%.

Às vésperas das eleições, os jornais trazem a manchete: “31,6% devem votar no candidato A”. E o que isso quer dizer? Que o candidato será eleito? Para entender esse tipo de enunciado, é necessário compreender alguns conceitos de estatística, a área da matemática que cuida da probabilidade. Para entender uma pesquisa eleitoral, por exemplo, é necessário conhecer alguns conceitos: População é o universo que vai ser tema da pesquisa. No caso das pesquisas eleitorais, os eleitores brasileiros.

Como seria quase impossível consultar mais de 125 milhões de eleitores, delimita-se o número de entrevistados, o grupo que vai servir de amostragem.

Amostragem é um número reduzido de pessoas que representa a população total. Escolher quais pessoas serão entrevistadas é um problema complexo.

Se metade dos eleitores são mulheres e ser mulher é um fator que interfere no voto, então metade da amostragem deve ser de mulheres. Se a classe social a que pertence o eleitor interfere no voto, a amostragem deve se aproximar ao máximo das diversas classes sociais que formam a população.

Desse modo, se cada pessoa entrevistada representa o voto de 100.000 pessoas da população, cada entrevistado deve ser uma amostra, a mais fiel possível, dessas 100.000 pessoas.

Apesar de todo cuidado para escolher o público, e para calcular as previsões, os resultados não são exatos. Tanto que toda reportagem, de jornal ou televisão, deve exibir uma margem de erro da pesquisa.

Normalmente 3 ou 4 pontos percentuais para mais ou para menos.

Para entender como são feitos os cálculos, também é importante ter algumas noções básicas de estatística: média, desvio padrão e variância.

Média, desvio padrão e variância

Quanto foi a sua média de matemática no último bimestre? Um dos conceitos mais básicos e cotidianos da estatística, a média nada mais é que um valor que “representa” vários outros. Com os exemplos a seguir, você vai ver que é fácil. Imagine que, no bimestre, João fez cinco atividades que valiam nota nas aulas de matemática. Ele começou bem, mas terminou o bimestre mal. Tirou as seguintes notas: 9, 7, 5, 3, 2.

Qual será a sua média no fim do bimestre?

Para facilitar os cálculos, vamos adotar o seguinte padrão: S é a soma das notas, e n é o número de notas que ele teve. A média (M) será:

Note que a sua média não é igual a nenhuma das notas que ele tirou. É um número que mostra, mais ou menos, como João foi no bimestre.

Medidas de dispersão

Muitas vezes, a média não é suficiente para avaliar um conjunto de dados. Por exemplo, quando se fala em um grupo de mulheres com idade média de 18 anos. Esse dado, sozinho, não significa muito: pode ser que no grupo, muitas mulheres tenham 38 anos, e outras tantas sejam menininhas de dois!

É importante, então, conhecer outra medida, a de que diferença (dispersão) existe entre a média e os valores do conjunto.

Voltando ao exemplo das notas de João, podemos calcular o desvio, que é a diferença de cada nota em relação à média:

Notas Média Desvio
9 5,2 3,8
7 5,2 1,8
5 5,2 -0,2
3 5,2 -2,2
2 5,2 -3,2

Outro dado importante em estatística é obtido pela soma dos desvios ao quadrado. Cada desvio é elevado ao quadrado e, em seguida, somados:

Valores Média Desvio Quadrado dos desvios
9 5,2 3,8 14,44
7 5,2 1,8 3,24
5 5,2 -0,2 0,04
3 5,2 -2,2 4,84
2 5,2 -3,2 10,24
Soma dos quadrados dos desvios 32,8

A soma dos quadrados dos desvios dividida pelo número de ocorrências é chamada de variância.

Logo:

Outro valor que pode ser obtido a partir da média e da variância é o desvio padrão. Como os desvios foram elevados ao quadrado, deve-se tirar a raiz quadrada da variância e achar o desvio padrão:

Só para se ter uma idéia melhor do que significa o desvio padrão veja o seguinte exemplo:

Notas: (9, 9, 9, 1, 1, 1)

A média será:

E o desvio padrão será Dp = 4 (tente calculá-lo por conta própria).

Note que, apesar de esse aluno ter tido média 5, seu desempenho foi muito irregular (variou de 4 pontos! 5 + 4 = 9 e 5 – 4 = 1), o que não é tão bom assim.

No exemplo anterior pode-se interpretar que as notas, no geral, variaram entre (5,2 + 2,56) = 7,76 e (5,2 – 2,56) = 2,64 , ou seja, Joãozinho teve desempenho mais regular que esse outro aluno.

Posts Relacionados