BWRI: un índice para escoger que partido ver durante la Offseason

Resúmen

Las ganas de ver béisbol durante la offseason de la MLB me han llevado a crear un índice que ayuda a escoger que partido mirar sin saber nada más que la fecha y el día. Usando R, he puesto a punto un algoritmo que se fija en los cambios en la probablidid de ganar jugada a jugada, para poder descubrir los partidos más interesantes.

El código también tiene en cuenta el buen pitcheo, las situaciones de no-hitter, los walkoffs y la rivalidad, para obtener una combinación de diferentes tipos de partidos interesantes. BWRI es una clasificación porcentual, por lo que 1 es el partido más emocionante detectado por el algoritmo y 0 el peor. BWRI incluye temporadas de 2011 a 2020. Puedes profundizar en BWRI en modo de lista si quieres, pero mi sugerencia es usar el modo aleatorio, filtrando para juegos con una puntuación > 0.95, lo que viene a ser una selección similar a escoger el mejor partido de cada jornada. BWRI no tiene en cuenta el contexto de la temporada, sin embargo puedes filtrar que se muestren solo los partidos de la postemporada.

A fondo

Las offseason son demasiado largas. No me gusta mucho seguir el mercado de trades y agencia libre, así que por lo general paso tiempo viendo partidos de la temporada pasada, ansioso por descubrir relevistas o simplemente divirtiéndome con partidos emocionantes. No es ni la mitad de la divertido si se conoce de antemano el resultado del juego, pero esto no es difícil ya que hay más de 2,400 partidos en una temporada regular normal de MLB. A veces veo juegos aleatorios, pero luego encontré baseballrewatch.com, y eso me salvó durante el confinamiento de primavera. Desafortunadamente, el sitio web no se ha actualizado para la temporada 2020.

Fue entonces cuando pensé si sería posible hacer un índice para evaluar cuánto vale la pena volver a ver un juego, simplemente usando las estadísticas play by play del partido. Utilizando los datos de Retrosheet y los conocimientos de Albert, Marchi y Baumer, pude preparar fácilmente la herramienta básica para calcular el índice: probabilidad de ganar agregada (WPA) jugada a jugada, es decir, cómo cambia la probabilidad de ganar un partido jugada tras jugada. Esa es la herramienta principal utilizada para crear lo que he llamdo Baseball Worth Rewatch Index (BWRI), aunque hay otras cosas que tomé en cuenta.

WPA Total

Lo primero que pensé fue: si sumo los valores WPA absolutos de cada jugada en un partido, las cifras más altas me señalarán partidos emocionantes. Partidos que pasaron de las manos de un equipo a las de otro varias veces durante el juego. Drama, situaciones de ‘leverage’ y entretenimiento, especialmente en las últimas entradas, cuando un cambio en el marcador genera un valor más alto de WPA. Así pues, el primer factor de BWRI es el WPA Total, sin embargo, le hice algunos ajustes.

El principal problema es el “ruido” que generan las jugadas poco importantes. En partidos igualados, cualquier jugada añade casi el dobte de WPA que en partidos con 2 o 3 carreras de diferencia. Al final, un juego aburrido decidido en la octaba entrada resultaba tener demasiada puntuación, así que decidí usar solo las jugadas que cambiaban la probabilidad de ganar un 8% o más. Dos ejemplos recientes de WPA Total, en el primer partido de las Series Mundiales 2020, los Dodgers anotan 2 carreras en el cuarto y 4 más en el quinto, por lo que el juego obtiene un WPA Total bajo. En el otro lado de la balanza en cuarto partido de la serie obtiene uno de los valores más altos de WPA Total de los últimos 10 años en postemporada.

Y como curiosidad, aquí tienes el juego con la WPA más agregada desde 2011. Es muy reciente, al final de la temporada 2020 Atlanta gana a Boston con dos entradas extra. Toma la delantera con 3 carreras en el octavo, Boston empata el juego con 2 carreras en el noveno, cada equipo anota dos carreras en el décimo, Boston agrega una más en el undécimo, pero Atlanta finalmente gana con dos más y una caminata. Guau. Y nadie en las gradas.

Final inesperado (Unexpected Ouctome UO)

Es genial cuando el equipo que ha estado perdiendo la mayor parte del tiempo gana al final. Me encantan este tipo de partidos, y por lo general estos tienen un WPA Total bajo, porque durante la mayor parte del juego el equipo que al final gana va por detrás por un margen de 2 o más carreras. Al principio pensé que sería tan fácil como promediar la probabilidad de ganar y restarla del resultado final. Eso resultó ser insuficiente teniendo en cuenta mi propósito, así que decidí marcar la probabilidad de ganar desde la séptima entrada hasta el final, y en los dos últimos extrainnings, para detectar cambios tardíos. El indicador de final inesperado (UO) es una suma de todo eso.

Pitching

No todo son carreras y acción, los partidos con buen pitcheo son realmente divertidos. El pitching aquí se evalúa de dos formas sencillas. En primer lugar, cuántos Ks por entrada hay en un juego y como de cerca está un juego de ser un no-hitter. Desde los partidos que llegan a la séptima sin hits hasta los no-hitters, todos obtienen puntos extra. Sería muy bueno tener en cuenta también los catchs de baja probabilidad, desafortunadamente creo que estos datos no están disponibles por partido.

Partidos igualados (Close games CG)

Así como me guatan los finales inesperados, también es bueno cuando el juego es muy equilibrado. En ese caso, obtuve la diferencia entre la probabilidad de ganar y 0.5 en cada jugada, y sumé el valor absoluto de todas. Los valores bajos significan juegos parejos. Pensé en ello como un factor principal al principio, pero luego decidí mantenerlo bajo, ya que estropeaba la puntuación BWRI de algunos partidos emocionantes.

Walkoff

También hay puntos adicionales para walkoffs, la mayoría de ellos ya tienen una calificación alta en los indicadores principales, pero un impulso adicional ayuda a resaltar los finales felices para los equipos locales.

Rivalidad

Finalmente, agregué algunos puntos extra para juegos con rivalidad, para ese propósito utilizo datos de knowrivalry.com.

Otras características

Decidí calificar WPA Agregado y UO en un puntaje Z, por lo que los juegos muy desequilibrados no solo no agregan, sino que incluso restan valor en BWRI. Por otro lado, asumí que el buen pitching y todos los demás factores deben ser solo valores positivos y no disminuir la puntuación final. BWRI no tiene en cuenta el contexto de la temporada, pero se pueden filtrar solo los juegos de postemporada o filtrar por mes.

Si os preguntáis cuál es el peso de cada factor en la puntuación final del BWRI, la respuesta es que para los 500 juegos principales, el peso de WPA Aregados es de alrededor del 33% de la puntuación, el de UO del 32%, factor Ks 17%, partidos igualados 8%, walkoffs del 7%, la rivalidad es responsable de solo un poco más del 2% y el factor de no-hitter de un poco menos del 2%.

Aquí están los dos factores principales de BWRI, solo con partidos de las últimas 10 postemporadas. Fijaos en que que la mayoría de los partidos tienen algo de WPA Total, pero muchos no tienen una tasa de final inesperado (UO). He destacado algunos de los juegos que obtienen una puntuación alta. El punto más aislado es el increíble cuarto partido de las Series Mundiales de 2020. El sexto partido de las WS de 2011 también marca la diferencia, probablemente lo recordarás si te digo un nombre: David Freese. En el lado del UO, lo más notable según BWRI es la remontada de Oakland en la novena entrada en el Game 4 de la ALCS 2012, seguido por otra remontada, la de los Cubs en el cuarto partido de la NLDS 2016. el Game 7 de las Series Mundiales de aquel año también obtiene un BWRI de más de 0.8, pero califica como el segundo juego más emocionante de ese camino de los Cachorros hacia el título.

Para evaluar la probabilidad de ganarplay by play, utilicé el método sugerido por Max Marchi, Jim Albert y Benjami S. Baumer.

Espero que gocéis usándolo. Cualquier comentario o suggerencia serà bienvenida.

www.rewatchbaseballindex.com

Las previsiones meteorológicas del periódico ARA: un inusual proyecto de comunicación y programación hecho a medida

El sistema ha pasado de ser totalmente manual a utilizar con criterio la información directa de los modelos de previsión

Este mes el periódico ARA cumplirá 10 años, y creo que es un buen momento para explicar su proyecto de meteorología que he comandado desde el primer día. Me he entretenido a escribir esta especie de chala larguísima porqué creo que se han hecho cosas bastante únicas que quiero poner en valor, y porqué he trabajado muchas ideas con tanta libertad com soledad, y creo que es un ejercicio necesario y quizás interesante poderlo relatar y dar algunos detalles. >>> “Las previsiones meteorológicas del periódico ARA: un inusual proyecto de comunicación y programación hecho a medida”

Todo lo que el ‘The New York Times’ ha dicho de Barcelona y Catalunya

En 2019 hice un tema para el periódico ARA que combinaba un trabajo puramente de datos con un trabajo también de hemeroteca. A partir de distintas consultas a la API del The New York Times busqué coincidencias en el titular y o en el subtítulo de palabras como ‘Barcelona’, ‘Catalonia’, ‘catalans’, y también nombres de otras ciudades catalanas en sus posibles diferentes versiones. Construí una base de datos con toda la información para poder hacer consultas por tiempo y por temas que permitiesen visualizar el interés del periódico por épocas y temas. >>> “Todo lo que el ‘The New York Times’ ha dicho de Barcelona y Catalunya”

El otoño no ha desaparecido, pero se ha movido en el calendario

El verano se alarga y los meses de noviembre, diciembre y enero tienen cada vez más días con temperaturas suaves

Una de les cosas que muy probablemente debéis haber comentado o oído estos días es que el otoño está desapareciendo. Después de un mes de octubre muy suave en muchas zonas, de repente ha llegado una entrada de aire frío que nos ha traído el ambiente de invierno. La sensación es que este viene siendo un hecho habitual en los últimos años ¿pero realmente el otoño está en peligro de estinción? Los datos dicen que más bien se está desplazando, y que sobretodo está abandonando el mes de octubre. >>> “El otoño no ha desaparecido, pero se ha movido en el calendario”

Hoy es Opening Day: 5 claves y curiosidades de la nueva temporada de la MLB

Arizona utilizará un humidificador para reducir el número de ‘home runs’ en su estadio

Decía Bill Veeck que sólo hay dos estaciones: el invierno y el béisbol. Hoy se acaba el invierno y arranca una nueva temporada de la MLB estadounidense. Los últimos participantes de las World Series, Houston Astros y Los Angeles Dodgers, parten como favoritos en una temporada que también tendrá los Yankees, los Cubs y los Nationals entre los aspirantes al título. Por primera vez desde 1968 todos los equipos jugarán el primer partido de la temporada el mismo día; hoy es Opening Day y todos los mejores lanzadores estarán sobre el campo. Arrancarán así seis meses en los que cada equipo disputará 162 partidos, un calendario frenético en el que hay partidos casi todos los días, y un equipo puede llegar a jugar dos partidos en una sola jornada. Os destacao cinco claves y curiosidades de esta temporada 2018. >>> “Hoy es Opening Day: 5 claves y curiosidades de la nueva temporada de la MLB”