¿Qué selección ganará el Mundial? Así funciona nuestro simulador y sus predicciones | Mundial Qatar 2022

Queremos responder una pregunta difícil y divertida: ¿Qué opciones de ganar el Mundial tiene cada selección? Para hacerlo simulamos el torneo decenas de miles de veces. Así podemos calcular qué probabilidad tiene cada equipo de llegar a octavos, jugar las semifinales o llevarse el torneo.

Esta es nuestra predicción de partida:

PROBABILIDAD DE ALCANZAR CADA PHASE Y DE GANAR EL MUNDIAL

Estos datos nos dicen qué equipos son favoritos y en qué medida lo son. También capturan una realidad: el mundial es bastante imprevisible. Las personas esperamos que gane el favorito, pero los datos dicen que eso es raro: aunque Brasil tiene más opciones de ganar que ningún otro equipo, Brasil solo ganará una de cada cuatro veces.

Estas probabilidades se actualizarán cada día, aquí en EL PAÍS. A continuación explicamos como funciona el modelo, empezando con un juego…

Simule su un mundial

Haciendo clic en el botón de abajo puede simular un mundial con el modelo y ver quién gana. Si vuelve a clicar, harás una segunda simulación y seguramente ganará otro. Sus ganadores se van acumulando en la tabla.

Si pasa un rato jugando con esto, verá que los porcentajes de ganadores convergen a la tabla del principio. Lo hará despacio, porque así es el azar.

Como functionala el modelo

Nuestras predicciones son el resultado de hacer miles de simulaciones como las anteriores, que solo son azarosas en parte. En cada partido, la probabilidad de que gane uno u otro equipo depende de sus estadísticas. Por ejemplo, si Brasil juega contra Arabia Saudí, la probabilidad de que gane el primero ronda el 87%.

El modelo tiene tres partes:

1. ¿Cómo de fuerte es cada equipo? Para capturar esto usamos dos métricas: sus resultados recientes (medidos con un ránking Elo, un método original del ajedrez y que ahora también usa el ránking oficial de la FIFA) y la calidad de sus jugadores (medida con su valor en euros, con datos de la web Transfermarkt).

2. ¿Quién gana cada partido? Hemos entrenado un modelo con miles de encuentros para, dados dos equipos y sus métricas de fortaleza, estimar como de probable es cada resultado. El modelo dice la probabilidad de victoria, empate y derrota, e incluso la de cada marcador. Por ejemplo, en ese duelo hipotético entre Brasil y Arabia Saudí, los resultados más probables son 2-0 y 3-0, con alrededor del 14% cada uno.

3. ¿Y para predecir el mundial completo? Lo que hacemos es simularlo partido a partido, cruce a cruce. Eso lo repetimos miles de veces, para tener 100,000 mundiales posibles, y así poder estimar la probabilidad de cada evento. Si Brasil gana el torneo en 23,000 de 100,000 simulaciones, es porque tiene un 23% de probabilidades.

Sigue leyendo si quieres más details. Si quieres ver las últimas predicciones, las tendrás aquí cada día.

Preguntas Frecuentes

¿Entonces decís que va a ganar Brasil? No, no. Nuestro modelo dice que Brasil es la selección con más probabilidades, pero también que tiene solo una opción entre cuatro de ganar. Es importante interpretar bien esto: en realidad, su victoria es tan poco probable como ver fallar un penalti.

Estos datos vienen a demostrar que un mundial es difícil de predecir. Y no es una sorpresa. Primero, es un torneo diseñado para que la suerte influya: no es una liga regular, no tiene playoffs, ni partidos de ida y vuelta. Segundo, las selecciones juegan pocos partidos importantes y su rendimiento es más incierto que el de un club. Y, tercero, estamos hablamos de fútbol, ​​un deporte apasionante porque está lleno de sorpresas. Casi nadie se sentaría a ver un partido, si el resultado estuviese decidido.

Do otras predicciones exist? Si. En la tabla siguiente mostramos otras tres que nos parecen interesantes: el modelo estadístico de The Analyst, las cuotas de una Treintena de casas de apuestas y los pronósticos de la comunidad de pronosticadores Metaculus.

PROBABILIDAD DE GANAR EL MUNDIAL SEGÚN OTRAS PREDICCIONES

¿Habéis hecho esto antes? Si. Usamos un modelo parecido en el mundial de 2018. Aquí podéis learn qué tal funcionó. El modelo se demostró bien calibrado: los resultados a los que dábamos una probabilidad entre 0% y 10% ocurrieron el 3% de las veces, por ejemplo, y aquellos con probabilidad 90% o 100% ocurrieron siempre. Lo hicimos mucho mejor que el azar, mejor que el ránking FIFA y que dos grandes bancos (UBS y Goldman Sachs). No batimos a las apuestas, y hay que decir que el mundial lo ganó Francia, que solo era nuestra sexta favorita al empezar.

¿Debería apostar usando vuestros pronósticos? no. Nuestro modelo es relativamente sofisticado y puede funcionar bien. Pero las apuestas han demostrado en el pasado que son muy difíciles de mejorar. Además, para no perder dinero no basta con batirlas, también hay que compensar el margen que se reservan las casas de apuestas al fijar los precios.

Esto no es una sorpresa. Los modelos estadísticos son útiles como referencia, por transparencia y porque nos permiten calcular detalles que las apuestas no responden. Pero, a la hora de acertar, las apuestas usan una aproximación híbrida: combinan modelos propios con el ajuste fino que hacen sus expertos, para considerar la información extra que poseen, como detalles de estilos de juego, estados de forma o lesiones.

More details technicos

Que es un ranking Elo. Es una métrica que captura la fuerza de cada equipo según sus resultados. Cada equipo tiene cierta cantidad de puntos —sus puntos Elo—, y cuando se juega un partido se produce un intercambio. El ganador se lleva puntos del perdedor. Si la victoria es por sorpresa (porque se impone el equipo débil) los equipos se intercambian más puntos. Los ránking Elo funcionan bien y se usan cada vez más, en deportes y en videojuegos, por ejemplo, para organizar partidas entre jugadores de nivel parecido. Nuestro modelo usa el ranking Elo de la web Eloratings.

Por qué usamos el valor de las plantillas. Porque las selecciones juegan pocos partidos competitivos y eso dificulta medir su rendimiento antes de una gran cita. Una forma de añadir información al modelo sobre la calidad de cada selección es usar el valor en el mercado de fichajes de los jugadores que las componen. Tomamos los datos de la popular web Transfermarkt, ajustados por la edad de los jugadores (los mayores de Treinta se abaratan por tener menos años de carrera por delante).

Como funciona el simulador de partidos. Hemos ajustado un modelo sencillo que estima los goles que marcará cada equipo en función de si es mejor o peor que su rival, en puntos Elo y valor de plantillas. El modelo también tiene en cuenta si los partidos tienen un anfitrión o se juegan en campo neutral, pero eso apenas influye en el mundial. Usamos una distribución de tipo Poisson, que ajusta razonablemente los goles en fútbol y que se ha usado en modelos estadísticos y estudios académicos.

Al final, para nuestro modelo la probabilidad de que un equipo gane un partido depende de números: las diferencias con el rival en puntos Elo y en valor de plantillas. El grafico lo resume con numeros:


Un resumen del modelo. El gráfico muestra la probabilidad que tiene un equipo de ganar un partido en función de dos parámetros: las diferencia sobre su rival en puntos Elo y en valor económico de sus plantillas.

Un equipo con una plantilla 160 millones más cara que su rival y con 200 puntos más de Elo gana el 62% de sus duelos

Differentia de

valor de

160 millions

Un resumen del modelo. El gráfico muestra la probabilidad que tiene un equipo de ganar un partido en función de dos parámetros: las diferencia sobre su rival en puntos Elo y en valor económico de sus plantillas.

Un equipo con una plantilla 160 millones más cara que su rival y con 200 puntos más de Elo gana el 62% de sus duelos

Differentia de

valor de

160 millions

Un resumen del modelo. El gráfico muestra la probabilidad que tiene un equipo de ganar un partido en función de dos parámetros: las diferencia sobre su rival en puntos Elo y en valor económico de sus plantillas.

Un equipo con una plantilla 160 millones más cara que su rival y con 200 puntos más de Elo gana el 62% de sus duelos

Diferencia de valor de

160 millions

Que acierto podemos esperar del modelo. Para calibrarlo hemos usado una base de datos de 18,000 partidos de selecciones desde 2004, incluidos cientos de Mundiales y Eurocopas.

Con datos de entrenamiento, el modelo acierta el resultado del 60% de los partidos con equipo local y el 56% en campo neutral. Evaluado en términos probabilísticos, las predicciones del modelo obtienen una puntuación de entre 0,176 y 0,186 (expresado con un Ranking Probability Score, como se explica aquí o aquí). Una precisión razonable, si la comparamos con otros modelos o con las apuestas deportivas.


Entrenamiento del modelo. Los puntos representan los resultados de partidos reales y las líneas las predicciones del modelo. Para partidos entre equipos con cierta diferencia de Ranking Elo (eje x), se muestra la probabilidad o el porcentaje que acaban en derrota, empate o victoria (eje y).

Entrenamiento del modelo. Los puntos representan los resultados de partidos reales y las líneas las predicciones del modelo. Para partidos entre equipos con cierta diferencia de Ranking Elo (eje x), se muestra la probabilidad o el porcentaje que acaban en derrota, empate o victoria (eje y).

Entrenamiento del modelo. Los puntos representan los resultados de partidos reales y las líneas las predicciones del modelo. Para partidos entre equipos con cierta diferencia de Ranking Elo (eje x), se muestra la probabilidad o el porcentaje que acaban en derrota, empate o victoria (eje y).

También podéis poder la evaluación que hicimos de nuestro modelo de 2018, después de acabar el mundial.

¿Por qué usamos un modelo que predice goles y no directamente victorias? Tiene dos ventajas hacerlo así: nos sirve para resolver la phase de grupos y para predecir prórrogas (como partidos de 30 minutos).

Algunos estudios (desde Dixon & Coles, 1997) dicen que los modelos que predicen goles infraestiman los empates que realmente se producen. Hemos comprobado que es así en la Champions y en las grandes ligas europeas, pero el efecto es menor en los mundiales y hemos decidido no hacer ajustes.

¿Quieres ver las últimas predicciones? Las puedes consultar actualizadas cada día en la página web del modelo.

credits

Diseno: Ignacio Povedano

Interactive simulator: Jose A. Alvarez Iguacel

Desarrollo: Carlos Munoz

Modelo estadistico: Kiko Llaneras and Borja Andrino

coordination: Brenda Valverde Rubio and Guiomar del Ser

Direction de arte: Fernando Hernandez

Leave a Comment