O que é a Estatística Página 3 Pedagocia & Comunicação
Estatística é a ciência das probabilidades, o conjunto de
regras matemáticas que permite fazer previsões sobre determinado
universo estudado, a partir de uma amostragem significativa.
Uma apresentação como essa tende a reforçar a idéia
de que estatística é uma espécie de álgebra burocrática,
cujas fórmulas incompreensíveis são utilizadas para defender
conclusões suspeitas.
Esse preconceito contra a estatística não vem de agora. Benjamin
Disraeli, político britânico do século 19, dizia que há
"mentiras, mentiras deslavadas e estatísticas".
Uma piada diz que se uma pessoa come dois frangos e outra nenhum, não
há qualquer problema, pois, estatisticamente, elas comem um frango cada.
Essa é uma conclusão fácil para quem resume a estatística
ao cálculo da média aritmética. Se nos aprofundarmos, porém,
em alguns de seus conceitos e ferramentas básicas, que utilizam cálculos
aritméticos simples, verificaremos que os cenários projetados
pela estatística são mais confiáveis do que sugerem as
ironias divertidas, mas um tanto rasas, que lhe são dirigidas.
Representação gráfica com porcentagens.
Nota-se que o total das partes dá 100%.
Às vésperas das eleições, os jornais trazem a manchete:
"31,6% devem votar no candidato A". E o que isso quer dizer? Que o candidato
será eleito? Para entender esse tipo de enunciado, é necessário
compreender alguns conceitos de estatística, a área da matemática
que cuida da probabilidade. Para entender uma pesquisa eleitoral, por exemplo,
é necessário conhecer alguns conceitos:
População é o universo que vai ser tema da pesquisa. No
caso das pesquisas eleitorais, os eleitores brasileiros.
Como seria quase impossível consultar mais de 125 milhões de
eleitores, delimita-se o número de entrevistados, o grupo que vai servir
de amostragem.
Amostragem é um número reduzido de pessoas que representa a população
total. Escolher quais pessoas serão entrevistadas é um problema
complexo.
Se metade dos eleitores são mulheres e ser mulher é um fator
que interfere no voto, então metade da amostragem deve ser de mulheres.
Se a classe social a que pertence o eleitor interfere no voto, a amostragem
deve se aproximar ao máximo das diversas classes sociais que formam a
população.
Desse modo, se cada pessoa entrevistada representa o voto de 100.000 pessoas
da população, cada entrevistado deve ser uma amostra, a mais fiel
possível, dessas 100.000 pessoas.
Apesar de todo cuidado para escolher o público, e para calcular as previsões,
os resultados não são exatos. Tanto que toda reportagem, de jornal
ou televisão, deve exibir uma margem de erro da pesquisa.
Normalmente 3 ou 4 pontos percentuais para mais ou para menos.
Para entender como são feitos os cálculos, também é
importante ter algumas noções básicas de estatística:
média, desvio padrão e variância.
Média, desvio padrão e variância
Quanto foi a sua média de matemática no último bimestre?
Um dos conceitos mais básicos e cotidianos da estatística, a média
nada mais é que um valor que "representa" vários outros.
Com os exemplos a seguir, você vai ver que é fácil. Imagine
que, no bimestre, João fez cinco atividades que valiam nota nas aulas
de matemática. Ele começou bem, mas terminou o bimestre mal. Tirou
as seguintes notas: 9, 7, 5, 3, 2.
Qual será a sua média no fim do bimestre?
Para facilitar os cálculos, vamos adotar o seguinte padrão:
S é a soma das notas, e n é o número de notas que ele teve.
A média (M) será:
Note que a sua média não é igual a nenhuma das notas que
ele tirou. É um número que mostra, mais ou menos, como João
foi no bimestre.
Medidas de dispersão
Muitas vezes, a média não é suficiente para avaliar um
conjunto de dados. Por exemplo, quando se fala em um grupo de mulheres com idade
média de 18 anos. Esse dado, sozinho, não significa muito: pode
ser que no grupo, muitas mulheres tenham 38 anos, e outras tantas sejam menininhas
de dois!
É importante, então, conhecer outra medida, a de que diferença
(dispersão) existe entre a média e os valores do conjunto.
Voltando ao exemplo das notas de João, podemos calcular o desvio, que
é a diferença de cada nota em relação à média:
Notas
Média
Desvio
9
5,2
3,8
7
5,2
1,8
5
5,2
-0,2
3
5,2
-2,2
2
5,2
-3,2
Outro dado importante em estatística é obtido pela soma dos
desvios ao quadrado. Cada desvio é elevado ao quadrado e, em seguida,
somados:
Valores
Média
Desvio
Quadrado dos desvios
9
5,2
3,8
14,44
7
5,2
1,8
3,24
5
5,2
-0,2
0,04
3
5,2
-2,2
4,84
2
5,2
-3,2
10,24
Soma dos quadrados dos desvios
32,8
A soma dos quadrados dos desvios dividida pelo número de ocorrências
é chamada de variância.
Logo:
Outro valor que pode ser obtido a partir da média e da variância
é o desvio padrão. Como os desvios foram elevados ao quadrado,
deve-se tirar a raiz quadrada da variância e achar o desvio padrão:
Só para se ter uma idéia melhor do que significa o desvio padrão
veja o seguinte exemplo:
Notas: (9, 9, 9, 1, 1, 1)
A média será:
E o desvio padrão será Dp = 4 (tente calculá-lo por conta
própria).
Note que, apesar de esse aluno ter tido média 5, seu desempenho foi
muito irregular (variou de 4 pontos! 5 + 4 = 9 e 5
- 4 = 1), o que não é tão bom assim.
No exemplo anterior pode-se interpretar que as notas, no geral, variaram entre
(5,2 + 2,56) = 7,76 e (5,2 - 2,56) = 2,64
, ou seja, Joãozinho teve desempenho mais regular que esse outro aluno.