Modelos Predictivos NHL para Principiantes: Cómo Empezar tu Propio Análisis
Cargando...
Contenido
No necesitas ser data scientist para construir un modelo predictivo básico de la NHL. Necesitas datos accesibles —que son gratuitos—, una hoja de cálculo —que ya tienes— y un proceso reproducible que convierta números en probabilidades comparables con las cuotas del mercado. Tu primer modelo será imperfecto, y eso es perfecto. Lo que importa no es la sofisticación del modelo, sino que tengas uno: un marco cuantitativo que reemplace las corazonadas por estimaciones fundamentadas.
La barrera de entrada al análisis de hockey ha bajado drásticamente en los últimos años. Sitios como Natural Stat Trick, MoneyPuck y Evolving Hockey publican métricas avanzadas de forma gratuita, y los datos de Hockey Analysis demuestran que los modelos públicos pueden rivalizar con los propietarios. La pregunta ya no es si puedes acceder a los datos — es si estás dispuesto a dedicar el tiempo necesario para organizarlos y darles sentido.
Datos y Variables Clave para tu Primer Modelo
Un modelo predictivo para la NHL no necesita cincuenta variables para ser útil. Necesita las correctas, bien medidas y correctamente ponderadas. Para un primer modelo, seis variables son suficientes para generar estimaciones que superen la intuición pura.
Las seis variables de un modelo básico
Primera: xGF% en 5-contra-5 (últimos 15-20 partidos). El Expected Goals For Percentage mide la calidad del juego de un equipo en igualdad numérica. Es la variable con mayor poder predictivo disponible públicamente, y sirve como columna vertebral del modelo. Un equipo con xGF% del 54% genera consistentemente mejores oportunidades que uno con 47%, y esa diferencia se traduce en resultados a medio plazo.
Segunda: GSAA del portero confirmado. El portero es la variable individual más influyente en el resultado de un partido de hockey. Si conoces el GSAA del portero que jugará, tienes una estimación directa de cuántos goles evitará (o concederá) por encima de la media. Esa información ajusta la proyección de goles del modelo de forma significativa.
Tercera: PP% y PK% recientes (últimos 10-15 partidos). Los equipos especiales fluctúan más que el rendimiento en 5-contra-5, pero su contribución a los goles totales es relevante. Incluirlos añade precisión a la estimación de totales.
Cuarta: home/away. La ventaja local existe en la NHL (~54% de victorias para el equipo local en 2024-25) y debe incorporarse como un factor de ajuste. No es una variable dominante, pero omitirla introduce un sesgo sistemático.
Quinta: back-to-back. Si alguno de los equipos juega la segunda noche consecutiva, el modelo debe penalizar su rendimiento esperado. Los datos de ESPN cuantifican la magnitud de ese efecto.
Sexta: Corsi For% como filtro complementario. El Corsi no es un predictor fuerte por sí solo (su R² con el GF% es de solo 0,2736), pero funciona como señal de alerta: un equipo con CF% inferior al 47% tiene un problema de posesión que el xGF% puede no capturar completamente si la muestra de xG es pequeña.
Dónde obtener los datos
Natural Stat Trick ofrece xGF%, CF%, FF% y PP%/PK% filtrados por situación (5v5, all situations) y por rango de partidos. MoneyPuck proporciona xG por partido y proyecciones de temporada. Evolving Hockey publica GSAA y GSAx por portero. Todos son gratuitos. Los datos se copian manualmente en una hoja de cálculo o, para quienes saben programar, se extraen con scripts sencillos.
La estructura de tu hoja de cálculo puede ser tan simple como una fila por partido con columnas para cada variable. Para cada enfrentamiento, registras el xGF% de ambos equipos, el GSAA de ambos porteros, PP% y PK%, si hay back-to-back, y quién juega en casa. Con esas seis columnas por equipo, tienes la materia prima para generar una estimación de probabilidad. La fórmula no tiene que ser una regresión compleja: un promedio ponderado donde el xGF% tiene el mayor peso (40-50%), seguido del GSAA (20-25%) y el resto repartido entre las demás variables, ya produce estimaciones que superan a la intuición pura.
Un dato adicional refuerza por qué los modelos públicos son una base viable: un análisis de Hockey Analysis demostró que el modelo xG público de Evolving Hockey alcanzó un R² de 0,942 al compararlo con el modelo propietario de SportLogiq. Es decir, el 94% de la información que contiene un modelo de miles de dólares está disponible gratuitamente para quien sepa usarla. Y una referencia complementaria: el R² del Corsi con el GF% es de solo 0,2736 según Hockey-Statistics.com, lo que confirma que usar Corsi como única variable sería insuficiente, pero como filtro complementario dentro de un modelo multivariable aporta información adicional.
Del Modelo a la Apuesta: Backtesting y Calibración
Un modelo que no ha sido testeado contra la realidad es una opinión disfrazada de análisis. El backtesting es el proceso de aplicar tu modelo a partidos ya disputados y comparar sus predicciones con los resultados reales y, lo más importante, con las cuotas que ofrecía el mercado en ese momento.
Cómo hacer backtesting básico
El proceso es directo. Selecciona una muestra de 50-100 partidos recientes de la NHL. Para cada partido, registra: las variables de tu modelo (xGF%, GSAA, etc.), la probabilidad que tu modelo asigna a cada resultado, la probabilidad implícita de las cuotas del mercado, y el resultado real. Después, compara: ¿tu modelo asignó probabilidades más precisas que el mercado? ¿Los partidos donde tu modelo divergía significativamente del mercado produjeron resultados más alineados con tu estimación o con la del operador?
Si tu modelo es consistentemente más preciso que el mercado en una muestra de 100+ partidos, tienes una ventaja explotable. Si no lo es, necesitas recalibrar — ajustar los pesos de las variables, añadir factores que omitiste, o reconocer que tu modelo, en su forma actual, no supera al mercado. Ambos resultados son valiosos: el primero te da confianza para apostar; el segundo te ahorra dinero al no apostar con un modelo deficiente.
Calibración: el proceso continuo
Un modelo no se construye una vez y se olvida. Las dinámicas de la NHL cambian a lo largo de la temporada: equipos que adquieren piezas en el trade deadline, porteros que se lesionan, sistemas tácticos que evolucionan. Tu modelo debe reflejar esos cambios. La recomendación es recalibrar los pesos cada 4-6 semanas, utilizando la muestra más reciente de partidos como base. Ese ciclo de predicción-resultado-ajuste es lo que convierte un modelo básico en un sistema que mejora con el tiempo.
No subestimes la ventaja de tener un modelo imperfecto. La mayoría de los apostadores de hockey operan sin ningún marco cuantitativo — seleccionan partidos por intuición, por lealtad a equipos o por titulares mediáticos. Un modelo básico con seis variables y una hoja de cálculo, recalibrado mensualmente y testeado contra resultados reales, supera a la intuición pura con una consistencia que se manifiesta a lo largo de la temporada. No será perfecto. Pero será sistemático, y en apuestas deportivas, un sistema imperfecto supera al mejor instinto.
