Circuito Deluca

#Copa2014 – Estatísticos cravam Brasil campeão

Publicada em 12/06/2014 11:30

Do estatístico mais pop dos Estados Unidos _ Nate Silver, que que virou celebridade ao prever o resultado de eleições nos Estados Unidos em 2012 _ a pesquisadores da Universidade Federal de São Carlos (UFSCar) e do Instituto de Ciências Matemáticas e de Computação (ICMC) da USP, passando por profissionais do Itaú BBA e da Goldman Sachs e UniCredit, a previsão é uma só: Brasil campeão da Copa 2014, em casa!

Até o renomado físico Stephen Hawking aposta na nossa seleção.

Como cada um deles chegou à mesma cconclusão? Usando diferentes ferramentas estatísticas.

Basicamente, o que diferencia um resultado do outro é o modelo estatístico adotado e a maneira como as previsões são disponibilizadas.

Nate Silver usou um algoritmo desenvolvido por ele para a ESPN, em 2010, na Copa da África, para calcular as chances de cada equipe de avançar além da fase de grupos e vencer o torneio. O Soccer Power Index (SPI) aponta o Brasil como o grande favorito, com 45% de chance de ganhar a Copa do Mundo, bem à frente da Argentina (13%), Alemanha (11%) e Espanha (8%).

A análise coincide com a realizada pela casa de apostas Betfair, para calcular o prêmio pago.


Os profissionais da Goldman Sachs, por sua vez, decidiram aplicar os mesmos modelos estatísticos utilizados para fazer previsões da economia mundial. As previsões para cada jogo são baseadas em uma análise que usa dados históricos de jogos internacionais de futebol, desde 1960. Pentacampeão mundial e vencedor de várias competições internacionais, é mais que natural que o Brasil apareça como o grande favorito.


Já os pesquisadores da Universidade Federal de São Carlos (UFSCar) e do Instituto de Ciências Matemáticas e de Computação (ICMC) da USP decidiram usar um modelo estatístico que agrupa a informação contidas em 18 sites de apostas a respeito dos jogos da primeira fase.

“Com estas informações é possível estimar as qualidades de ataque e defesa dos times envolvidos na competição e estimar as chances de cada uma das equipes avançar na disputa”, conta Luís Ernesto Bueno Salasar, professor do Departamento de Estatística (DEs) e um dos coordenadores do grupo.

O grupo decidiu criar um site para  tornar públicas as probabilidades de resultados para todos os jogos da primeira fase, além das probabilidades de cada equipe avançar para as fases seguintes e de classificação para cada grupo.  Intitulado Previsão Esportiva e disponível em www.previsaoesportiva.com.br/copa/, o site também permite  a interação do internauta com a modelagem usada pelos pesquisadores. No link ‘Sua Previsão’, o internauta pode incluir suas opiniões e visualizar as chances das equipes para a segunda fase da competição”.

Salasar conta que o site foi criado em 2011, embora o grupo exista desde 2006, quando fez a primeira previsão sobre a Copa da Alemanha. “A ideia da formação do grupo surgiu quando eu e um colega, Adriano Suzuki, fazíamos mestrado na UFSCar e o professor Francisco Louzada nos fez a proposta de prever os resultados daquele campeonato”, lembra Salasar.

Na Copa de 2010, na África, o grupo acertou a previsão: Espanha estaria na final com a Holanda e seria campeã.

Para esta copa, o grupo também prevê Brasil e Argentina na final e Brasil como campeão.


“Esperamos que esta iniciativa sirva para ilustrar o potencial que a Estatística tem para lidar com problemas nas mais diversas áreas do conhecimento, e que seja um incentivo para que estudantes se interessem pelo curso”, afirma o pesquisador.

Big Data é um grande mercado
Com aumento do interesse das organizações pela implementação de projetos de Big Data, a profissão de cientista de dados ganhou importância e se tornou uma carreira promissora, tendo sido considerada pela revista Harvard Business Review como o emprego mais sexy do século 21.

As empresas estão (e vão continuar) procurando profissionais com um conjunto complexo de habilidades para concretizar a promessa de Big Data de promover vantagem competitiva.

Mas cuidado!

A capacidade de correlacionar dados e tirar conclusões a partir deles pode ser valiosa, mas também é desafiadora. Estatísticos e cientistas de dados costumam dizer que todos os modelos são falhos e apresentam uma ilusão da realidade. Isto é especialmente verdadeiro em ambientes de alta densidade causais (por exemplo, o comportamento humano, finanças, clima, saúde, políticas públicas). O ajuste fino de modelos estatísticos  torna-se uma série interminável de experiências práticas.

De um ponto de vista probabilístico, no qual as incertezas associadas são mensuradas de forma coerente, o modelo adotado pelos pesquisadores brasileiros, por exemplo, considera informações subjetivas obtidas por meio de um consenso de opiniões disponíveis em sites de apostas assim como placares observados durante a competição. Portanto, pode mudar ao longo do tempo.