BWRI: un índice para escoger que partido ver durante la Offseason

Resúmen

Las ganas de ver béisbol durante la offseason de la MLB me han llevado a crear un índice que ayuda a escoger que partido mirar sin saber nada más que la fecha y el día. Usando R, he puesto a punto un algoritmo que se fija en los cambios en la probablidid de ganar jugada a jugada, para poder descubrir los partidos más interesantes.

El código también tiene en cuenta el buen pitcheo, las situaciones de no-hitter, los walkoffs y la rivalidad, para obtener una combinación de diferentes tipos de partidos interesantes. BWRI es una clasificación porcentual, por lo que 1 es el partido más emocionante detectado por el algoritmo y 0 el peor. BWRI incluye temporadas de 2011 a 2020. Puedes profundizar en BWRI en modo de lista si quieres, pero mi sugerencia es usar el modo aleatorio, filtrando para juegos con una puntuación > 0.95, lo que viene a ser una selección similar a escoger el mejor partido de cada jornada. BWRI no tiene en cuenta el contexto de la temporada, sin embargo puedes filtrar que se muestren solo los partidos de la postemporada.

A fondo

Las offseason son demasiado largas. No me gusta mucho seguir el mercado de trades y agencia libre, así que por lo general paso tiempo viendo partidos de la temporada pasada, ansioso por descubrir relevistas o simplemente divirtiéndome con partidos emocionantes. No es ni la mitad de la divertido si se conoce de antemano el resultado del juego, pero esto no es difícil ya que hay más de 2,400 partidos en una temporada regular normal de MLB. A veces veo juegos aleatorios, pero luego encontré baseballrewatch.com, y eso me salvó durante el confinamiento de primavera. Desafortunadamente, el sitio web no se ha actualizado para la temporada 2020.

Fue entonces cuando pensé si sería posible hacer un índice para evaluar cuánto vale la pena volver a ver un juego, simplemente usando las estadísticas play by play del partido. Utilizando los datos de Retrosheet y los conocimientos de Albert, Marchi y Baumer, pude preparar fácilmente la herramienta básica para calcular el índice: probabilidad de ganar agregada (WPA) jugada a jugada, es decir, cómo cambia la probabilidad de ganar un partido jugada tras jugada. Esa es la herramienta principal utilizada para crear lo que he llamdo Baseball Worth Rewatch Index (BWRI), aunque hay otras cosas que tomé en cuenta.

WPA Total

Lo primero que pensé fue: si sumo los valores WPA absolutos de cada jugada en un partido, las cifras más altas me señalarán partidos emocionantes. Partidos que pasaron de las manos de un equipo a las de otro varias veces durante el juego. Drama, situaciones de ‘leverage’ y entretenimiento, especialmente en las últimas entradas, cuando un cambio en el marcador genera un valor más alto de WPA. Así pues, el primer factor de BWRI es el WPA Total, sin embargo, le hice algunos ajustes.

El principal problema es el “ruido” que generan las jugadas poco importantes. En partidos igualados, cualquier jugada añade casi el dobte de WPA que en partidos con 2 o 3 carreras de diferencia. Al final, un juego aburrido decidido en la octaba entrada resultaba tener demasiada puntuación, así que decidí usar solo las jugadas que cambiaban la probabilidad de ganar un 8% o más. Dos ejemplos recientes de WPA Total, en el primer partido de las Series Mundiales 2020, los Dodgers anotan 2 carreras en el cuarto y 4 más en el quinto, por lo que el juego obtiene un WPA Total bajo. En el otro lado de la balanza en cuarto partido de la serie obtiene uno de los valores más altos de WPA Total de los últimos 10 años en postemporada.

Y como curiosidad, aquí tienes el juego con la WPA más agregada desde 2011. Es muy reciente, al final de la temporada 2020 Atlanta gana a Boston con dos entradas extra. Toma la delantera con 3 carreras en el octavo, Boston empata el juego con 2 carreras en el noveno, cada equipo anota dos carreras en el décimo, Boston agrega una más en el undécimo, pero Atlanta finalmente gana con dos más y una caminata. Guau. Y nadie en las gradas.

Final inesperado (Unexpected Ouctome UO)

Es genial cuando el equipo que ha estado perdiendo la mayor parte del tiempo gana al final. Me encantan este tipo de partidos, y por lo general estos tienen un WPA Total bajo, porque durante la mayor parte del juego el equipo que al final gana va por detrás por un margen de 2 o más carreras. Al principio pensé que sería tan fácil como promediar la probabilidad de ganar y restarla del resultado final. Eso resultó ser insuficiente teniendo en cuenta mi propósito, así que decidí marcar la probabilidad de ganar desde la séptima entrada hasta el final, y en los dos últimos extrainnings, para detectar cambios tardíos. El indicador de final inesperado (UO) es una suma de todo eso.

Pitching

No todo son carreras y acción, los partidos con buen pitcheo son realmente divertidos. El pitching aquí se evalúa de dos formas sencillas. En primer lugar, cuántos Ks por entrada hay en un juego y como de cerca está un juego de ser un no-hitter. Desde los partidos que llegan a la séptima sin hits hasta los no-hitters, todos obtienen puntos extra. Sería muy bueno tener en cuenta también los catchs de baja probabilidad, desafortunadamente creo que estos datos no están disponibles por partido.

Partidos igualados (Close games CG)

Así como me guatan los finales inesperados, también es bueno cuando el juego es muy equilibrado. En ese caso, obtuve la diferencia entre la probabilidad de ganar y 0.5 en cada jugada, y sumé el valor absoluto de todas. Los valores bajos significan juegos parejos. Pensé en ello como un factor principal al principio, pero luego decidí mantenerlo bajo, ya que estropeaba la puntuación BWRI de algunos partidos emocionantes.

Walkoff

También hay puntos adicionales para walkoffs, la mayoría de ellos ya tienen una calificación alta en los indicadores principales, pero un impulso adicional ayuda a resaltar los finales felices para los equipos locales.

Rivalidad

Finalmente, agregué algunos puntos extra para juegos con rivalidad, para ese propósito utilizo datos de knowrivalry.com.

Otras características

Decidí calificar WPA Agregado y UO en un puntaje Z, por lo que los juegos muy desequilibrados no solo no agregan, sino que incluso restan valor en BWRI. Por otro lado, asumí que el buen pitching y todos los demás factores deben ser solo valores positivos y no disminuir la puntuación final. BWRI no tiene en cuenta el contexto de la temporada, pero se pueden filtrar solo los juegos de postemporada o filtrar por mes.

Si os preguntáis cuál es el peso de cada factor en la puntuación final del BWRI, la respuesta es que para los 500 juegos principales, el peso de WPA Aregados es de alrededor del 33% de la puntuación, el de UO del 32%, factor Ks 17%, partidos igualados 8%, walkoffs del 7%, la rivalidad es responsable de solo un poco más del 2% y el factor de no-hitter de un poco menos del 2%.

Aquí están los dos factores principales de BWRI, solo con partidos de las últimas 10 postemporadas. Fijaos en que que la mayoría de los partidos tienen algo de WPA Total, pero muchos no tienen una tasa de final inesperado (UO). He destacado algunos de los juegos que obtienen una puntuación alta. El punto más aislado es el increíble cuarto partido de las Series Mundiales de 2020. El sexto partido de las WS de 2011 también marca la diferencia, probablemente lo recordarás si te digo un nombre: David Freese. En el lado del UO, lo más notable según BWRI es la remontada de Oakland en la novena entrada en el Game 4 de la ALCS 2012, seguido por otra remontada, la de los Cubs en el cuarto partido de la NLDS 2016. el Game 7 de las Series Mundiales de aquel año también obtiene un BWRI de más de 0.8, pero califica como el segundo juego más emocionante de ese camino de los Cachorros hacia el título.

Para evaluar la probabilidad de ganarplay by play, utilicé el método sugerido por Max Marchi, Jim Albert y Benjami S. Baumer.

Espero que gocéis usándolo. Cualquier comentario o suggerencia serà bienvenida.

www.rewatchbaseballindex.com

Los últimos cinco minutos son una mina para el Madrid

Sin los últimos 15 minutos de partido el Barça tendría 4 ligas más

Si sois culers esta escena os va a sonar: sales del cine domingo per la tarde, quitas el modo avión del móvil, y en alguno de tus grupos de WhatsApp hay movimiento. El Madrid no gana y sólo faltan 20 minutos. No te fías pero entras en un bar, venga, que aún vamos a sacar algo. Minuto 75 y el Madrid no gana, minuto 80 y aún pincha, minuto 85 y ya casi lo tenemos… Pero al final el gol cae, y te vas a casa cabreado por un partido que no tenías previsto ver. Que el Madrid siempre gana en el último minuto es uno de aquellos mantras que todo seguidor del Barça ha recitado alguna vez, pero que hay de real esta percepción histórica del barcelonismo?
>>> “Los últimos cinco minutos son una mina para el Madrid”

El aficionado más trágicamente famoso de Chicago vive escondido

Lo que hizo hace trece años desató una polémica que todavía dura

La línea que separa al espectador del jugador en el béisbol es terriblemente delgada. El campo no se acaba con las rayas, y a menudo los jugadores se caen o entran en las gradas para conseguir una eliminación. El gol del béisbol es golpear la pelota hasta fuera del campo, y el sueño de todo aficionado, cogerla. Sin saber esto no se puede entender que una afición, y casi una ciudad entera, puedan culpar a un espectador de una derrota de su equipo. Pasó en octubre de 2003. Los Chicago Cubs estaban a un paso de llegar a la final de la liga americana de béisbol por primera vez desde un lejano 1945. >>> “El aficionado más trágicamente famoso de Chicago vive escondido”

Hoy es Opening Day: 5 claves y curiosidades de la nueva temporada de la MLB

Arizona utilizará un humidificador para reducir el número de ‘home runs’ en su estadio

Decía Bill Veeck que sólo hay dos estaciones: el invierno y el béisbol. Hoy se acaba el invierno y arranca una nueva temporada de la MLB estadounidense. Los últimos participantes de las World Series, Houston Astros y Los Angeles Dodgers, parten como favoritos en una temporada que también tendrá los Yankees, los Cubs y los Nationals entre los aspirantes al título. Por primera vez desde 1968 todos los equipos jugarán el primer partido de la temporada el mismo día; hoy es Opening Day y todos los mejores lanzadores estarán sobre el campo. Arrancarán así seis meses en los que cada equipo disputará 162 partidos, un calendario frenético en el que hay partidos casi todos los días, y un equipo puede llegar a jugar dos partidos en una sola jornada. Os destacao cinco claves y curiosidades de esta temporada 2018. >>> “Hoy es Opening Day: 5 claves y curiosidades de la nueva temporada de la MLB”

Porqué es mejor apostar por la sorpresa que por el favorito

Les casas de apuestas cobran una comisión bastante más alta por apostar si se opta por un favorito que si se apuesta a una sorpresa relativa

Con una fácil búsqueda por la red se encuentran mil referencias sobre como lo hacen las casas de apuestas para ganar dinero, independientemente de cuales sean los resultados de los partidos. Lo hacen de distintas formas, pero la más básica es fácil de entender: te cobran una especie de comisión cada vez que apuestas, una comisión que ya está incluida cuando te ofrecen la cuota que se te pagará si ganas la apuesta. >>> “Porqué es mejor apostar por la sorpresa que por el favorito”

La influencia de los árbitros en el factor campo

Los árbitros señalan casi las mismas faltas a les equipos locales que a los visitantes, pero les enseñan más tarjetas amarillas, y aún más tarjetas rojas

Acabamos el anterior post citando a un libro de referencia para este blog: Scorecasting: The hidden influences behind how sports are played and games are won, en el cual en base al análisis estadístico de diferentes grupos de datos en diversos deportes Jon Wertheim y el economista Tobias Moskowitz llegaron a la conclusión que la responsabilidad del factor campo recae básicamente en los árbitros. >>> “La influencia de los árbitros en el factor campo”

Jugar en casa ya no es la ventaja que era

Análisis de todos los partidos de las cinco grandes ligas europeas de fútbol des de 1970 hasta la actualidad: en la década de los 70 los equipos de casa ganaban casi el 70% de los puntos, en los últimos años el dato ha incluso bajado del 60%.

Para estrenar blog he traducido un artículo que publiqué el agosto de 2015 en el periódico ARA. Un estudio sobre los resultados en las 5 grandes ligas de fútbol europeo, hecho a partir de una base de datos que construí con datasets del portal football-data.co.uk. He dividido el artículo en dos partes, aquí la primera: >>> “Jugar en casa ya no es la ventaja que era”