Números não mentem!
Esse é o slogan, certo?
Mas como todo slogan, ele não é perfeito, ainda mais quando usado sem a devida cautela.
Certo matemático de uma renomada universidade brasileira, claramente não usou do princípio da precaução num caso recente.
Um erro, que pode ser considerado até ingênuo, foi cometido.
Causado talvez pela ânsia de defender uma tese, talvez pela falta de conhecimento.
Independente do motivo, a coitada da matemática não precisava ser metida nessa confusão e ainda mais desse jeito.
Certa eleição apresentou seu resultado em diferentes urnas. Uma urna continha os votos de determinado período cronológico. As outras continham os demais votos distribuídos de maneira aleatória em relação a cronologia.
Pois bem, dito economista, formulou uma conclusão baseado no fato que a percentagem de votos observada na dita urna especial diverge enormemente da proporção observada nas outras urnas. Chegou-se a dizer que a probabilidade de isso ocorrer seria mais difícil do que ganhar na Mega-Sena.
Quem dera ganhar na Mega-Sena fosse fácil assim!
A verdade é que não se pode inferir matematicamente tal conclusão da comparação de amostras retiradas da mesma população, mas que foram selecionadas de maneiras distintas e sem conhecimento prévio sobre as suas respectivas distribuições de probabilidade. Pior ainda quando a amostra não aleatória, a urna em questão, tem como processo de seleção uma variável altamente correlacionada com a própria decisão de voto.
Deixa eu explicar o motivo disso tudo com um exemplo muito mais claro e próximo do cotidiano dos cariocas.
Suponha que alguém queira encontrar a proporção existente entre as etnias dos moradores da cidade do Rio de Janeiro.
Com esse intuito faz-se o seguinte experimento, cada pessoa moradora de cada bairro do Rio de Janeiro deve colocar na urna do seu bairro um voto que contém a cor da sua pele.
Sendo o número de votos grande o suficiente, ao fim da votação somando-se os votos de todas as urnas da cidade obteremos uma aproximação significativa da proporção de brancos, negros, amarelos, pardos e indígenas da população.
Até aí a estatística é perfeita.
Agora suponha que os moradores dos bairros do Leblon e da Gávea votaram em uma urna separada.
Você como um leitor inteligente já deve entender a que ponto quero chegar.
Os resultados dessa urna são claramente muito diferentes do resultado final. Mas porquê?
Será que todo o estudo sería inválido por causa dos resultados dessa urna?
Teríamos que anular os resultados dessa urna “manipulada” e contabilizar a etnia da população sem esses valores?
É verdade que é mais fácil ganhar na Mega-Sena do que o resultado dessa urna ser verdadeiro?
Que resposta você daria a todas essas perguntas?
Adoraria que ao menos a resposta à última pergunta fosse verdadeira, mas ficar rico da noite pro dia não é tão fácil assim como você já deve saber.
É claro, óbvio, evidente, manifesto que, como uma pessoa inteligente, a resposta que você deu a todas as perguntas acima foi um lindo e sonoro NÃO.
Mas por que os resultados tão diferentes da “urna da zona sul” fazem total sentido nesse caso?
É lógico! Simplesmente porque você está familiarizado com a relação existente entre o lugar de moradia das pessoas de maior poder aquisitivo do Rio de Janeiro e a sua etnia. Em termos estatísticos, essa urna não apresenta a mesma distribuição de probabilidades de votos que as urnas do resto da cidade.
A amostra da população contida nessa urna foi realizada de maneira discricionária através de um critério que apresenta alta correlação com o resultado do voto. Em outras palavras, existe uma alta correlação entre a etnia e o lugar de moradia no Rio de Janeiro, assim como existe entre a condição econômica de um país e o índice de aprovação do governo, ou sobre a inclinação política em um clube de futebol e a cronologia da associação.
Por esse exato motivo, o cálculo realizado pelo matemático é errado por princípio.
A probabilidade da urna em questão ter tamanha diferença de votos em relação às outras urnas pode ser até mesmo muito mais próxima de 100% do que da advogada probabilidade menor do que ganhar na Mega-Sena.
Isso ficou tão claro no exemplo de etnia descrito acima, como também deveria ser em uma análise isenta dos votos da eleição do clube em questão.
A verdade é uma só, é impossível calcular essa probabilidade sem conhecimento da distribuição de probabilidade entre a data de associação e a correspondente inclinação pelo voto em determinados candidatos do clube. Mais importante ainda, esse dado é impossível de ser auferido em eleições de voto secreto.
No fim, se a origem desse erro estatístico vem da falta de conhecimento, é lamentável que tenha sido propagado dessa maneira.
Se o erro foi cometido pela vontade de defender uma tese, é temerário perceber que tais resultados possam ser usados num processo legal sem o devido cuidado.
A única verdade nisso tudo é que o método usado e as conclusões obtidas sofreriam uma rejeição primária em qualquer processo de “peer review” de uma revista conceituada. Na verdade, as conclusões publicadas por veículos de informação de alta circulação justificariam até uma reprovação em cursos de estatística de nível universitário.
Mas voltando ao mais importante, não estou aqui para defender o Júlio, o Eurico, ou o Horta.
Só escrevi esse artigo para defender quem não tem culpa de nada e não pode se defender.
Coitada da Matemática ser difamada assim!
Renato Rodrigues
Currículo:
- PhD in Electric Power Systems – Universidad Pontifícia Comillas (Madrid, Spain)
(2010-today)
- Master in Electric Power Systems – Universidad Pontifícia Comillas (Madrid, Spain)
(2008-2010)
- Master in Industrial Economics – Universidade Federal do Rio de Janeiro (RJ, Brasil)
(2005-2007)
- Graduated in economics – Universidade Federal do Rio de Janeiro (RJ, Brasil)
(2000-2005)