Previsões Iniciais da Copa do mundo 2018

worldcup_telstar

O futebol é uma caixinha de surpresas
Essa é uma das máximas mais populares que rodeiam o futebol há muito tempo. Um resultado inesperado é inclusive um dos motivos que tornam o futebol o esporte mais popular no mundo. Algumas vezes o inesperado vai além de um jogo apenas e se torna um conto de fadas, como o Leicester que foi campeão do Campeonato Inglês de 2016.

Isso não seria diferente em Copas do Mundo. Na Copa de 2014 por exemplo, quem imaginaria que a Costa Rica ficaria em primeiro lugar de um grupo que era composto por Inglaterra, Itália e Uruguai? Ou que a Espanha, campeã da edição anterior em 2010, não passaria da fase de grupos?

Em situações de alta incerteza, um modelo para determinar um campeão pode nos trazer falsos insights. Trabalhar com as probabilidades de cada evento seria o mais correto e responsável. Aplicamos a mesma abordagem para problemas de negócio onde o nível de volatilidade é muito alto, como previsão de demanda para produtos de baixo giro.

Prevendo o resultado da Copa do Mundo de 2018
Para prever o resultado da Copa do Mundo de 2018 estimamos a chance de cada uma das seleções passar por cada fase do torneio, incluindo a chance de chegar na final e ser campeã.

O primeiro passo foi reunir informações que nos ajudassem nessa tarefa. Para isso utilizamos técnicas de web scraping para conseguir o histórico de resultados das partidas desde 1900. A partir da base histórica de jogos, montamos uma base de dados que incluiu a seleção adversária, o número de gols a favor e contra,  tipo de jogo (Copa do Mundo, Copa América, Eurocopa, amistoso) e a localização do jogo. Além dessa base, utilizamos o rank e pontuação de cada seleção (pelo sistema ELO, mesmo sistema utilizado para o ranking de jogadores de xadrez). Nós testamos o rank da Fifa para modelagem, mas o sistema ELO se provou muito mais assertivo.

Com o histórico de jogos desde a Copa do Mundo de 1994, desenvolvemos um modelo de Regressão de Poisson, calculando para cada jogo a probabilidade de uma seleção fazer X gols na seleção adversária. Considerando as diferentes probabilidades, simulamos 100 mil vezes os resultados da Copa do Mundo. A probabilidade de uma seleção ser campeã por exemplo é o número de vezes que ela aparece como campeã nas 100 mil simulações.

A taça do mundo é nossa?
O modelo nos diz que o Brasil é a seleção com maior probabilidade de vencer a Copa do Mundo, com 33%, seguido por Espanha (16%), Alemanha (15%), França (10%) e Argentina (8%). Apesar disso, outra forma de interpretar os resultados do modelo é que a probabilidade do Brasil não ser campeão é de 67% (o dobro em relação aos 33%).

Mesmo assim, a seleção brasileira possui uma distância significativa em relação à segunda colocada nas probabilidades. Isso se deve a excelente performance sob o comando do técnico Tite. Desde que o novo técnico assumiu, a seleção brasileira realizou 21 partidas, conquistando 86% dos pontos possíveis, marcando 47 gols a favor e sofrendo apenas 5 gols.

Probabilidades de cada seleção avançar
(Atualizado em 13/06 19h)

Fica para a próxima copa
As seleções com as menores chances de passar para as oitavas de final são Marrocos, Nigéria e Tunísia, todas com chances entre 8 e 9%. Além de possuírem menor expressividade no futebol, estão em grupos com seleções mais tradicionais e que normalmente apresentam melhores desempenhos em Copas do Mundo. Já a Arábia Saudita, uma seleção com as mesmas características das três anteriores, possui 18% de chegar as oitavas, pois está em um grupo com menor competitividade que os demais.

País sede
Muito se fala da vantagem de se jogar em casa, por apoio e pressão da torcida, mas será que ela vale para Copa do Mundo? Segundo nosso modelo esse é um dos principais fatores que podem ajudar a Rússia a ir mais longe na competição. Estimamos uma probabilidade de 68% da seleção russa passar para as oitavas, sendo que essa chance cai drasticamente para 11% quando olhamos para as quartas de finais.

Um ponto a se levar em consideração é a adoção do árbitro de vídeo pelo primeiro ano em Copas do Mundo. Muitas vezes, por pressão da torcida, árbitros marcam (ou deixam de marcar) infrações de maneira duvidosa. Esse fator tem grande potencial de ser diminuído com a adesão dessa tecnologia.

Já passou de fase
Uma maneira que podemos usar para definir se um grupo é mais equilibrado ou não é a partir da combinação de probabilidade dos dois países mais prováveis de passarem para as oitavas.

Nesse quesito temos que o grupo F é o mais equilibrado, sendo composto por Alemanha, Coréia do Sul, México e Suécia. A probabilidade de ambos Alemanha e México passarem para as oitavas de final é de apenas 44%, sendo o resultado mais esperado.

Do outro lado temos o grupo G, composto por Bélgica, Inglaterra, Panamá e Tunísia. Em 79% das simulações quem passou da fase de grupos foi Bélgica e Inglaterra.

Partidas para ficar de olho
Com a probabilidade do resultado de cada partida, podemos selecionar as que tem maior equilíbrio e que é mais complicado de se dizer um vencedor. Podemos destacar as seguintes partidas:

26/06 – Islândia (33%) -vs- Croácia (39%)
27/06 – México (41%) -vs- Suécia (31%)
28/06 – Inglaterra (42%) -vs- Bélgica (32%)

Atualizando resultados
Um ponto interessante nesse modelo de previsões é que podemos atualizar as probabilidades conforme formos conhecendo os resultados das partidas. Isso é fundamental pois um resultado inesperado pode acontecer e precisamos nos adaptar e entender o impacto disso no nosso resultado final.

Por exemplo, imagine que a Espanha, depois de demitir o técnico um dia antes da copa começar, não se classifique para as oitavas de final. Sendo a segunda seleção mais provável a ganhar o título, uma mudança significativa nas predições finais pode ocorrer e mudar o cenário completamente.

 

Probabilidades da Fase de Grupos
(Atualizado em 13/06 19h)
 
Grupo A

 
Grupo B

 
Grupo C

 
Grupo D

 
Grupo E

 
Grupo F

 
Grupo G

 
Grupo H

 

7 Comment

  1. Fernando Henrique Santos says: Responder

    Muito Obrigado pela dica, muito interessante!!!

  2. JULIO CESAR TRAJANO RODRIGUES says: Responder

    Muito bacana! Parabéns Nagano!

    1. Fernando Nagano says: Responder

      Obrigado Julinho, a partir de amanhã publicaremos atualizações diárias das probabilidades de cada seleção! Abs

  3. Muito bom. Parabéns!

  4. Thabta says: Responder

    Vou acompanhar por aqui as probabilidades 😉

  5. Pedro Steagall says: Responder

    Obrigado Carnaúba! Abs

Deixe uma resposta