Baseball Worth Rewatch Index ara té en compte en el moment de la temporada

Una de les característiques que li faltava al Baseball Worth Rewatch Index (BWRI) des que en vaig programar la primera versió, era la capacitat de tenir en compte el context de la temporada. L’índex no distingia entre un partit irrellevant del mes de setembre i un Game 7 de les Sèries Mundials.

Fa unes setmanes vaig enviar un correu anunciant que les puntuacions de la temporada 2024 ja estaven disponibles. Sorprenentment, vaig rebre una resposta molt interessant d’un dels conductors del meu pòdcast de beisbol preferit, que és Effectively Wild, Ben Lindbergh, que no només va percebre aquesta mancança, sinó que em va suggerir una solució: consultar el Championship Leverage Index (cLI) de Baseball Reference.

El Championship Leverage Index (cLI) mesura essencialment la importància d’un partit per a les possibilitats d’un equip de guanyar les Sèries Mundials. Citant Baseball Reference:

“Per a cada partit d’un equip, fem 25.000 simulacions de la resta de la temporada dues vegades. A la primera simulació, suposem que l’equip guanya el partit en qüestió. A la segona simulació, suposem que l’equip perd el partit en qüestió. La diferència entre les probabilitats de guanyar les Sèries Mundials després d’una victòria i una derrota mesura la importància d’aquest partit en les probabilitats de guanyar les Sèries Mundials de l’equip.”

En altres paraules, el cLI quantifica com és d’important un partit per a cada equip. Baseball Reference calcula aquesta mètrica per a cada equip i partit durant la temporada regular. En canvi, no es proporcionen valors de cLI per als partits de postemporada.

Vaig decidir adaptar el concepte per a la postemporada assignant un valor fix a cada tipus de sèrie i a cada fase de la sèrie. Per exemple, cada primer partit d’una Sèrie Divisional té el mateix valor. Amb aquest enfocament, vaig evitar centrar-me exclusivament en les probabilitats de guanyar les Sèries Mundials, ja que això inflaria desproporcionadament la importància dels partits més crítics de la postemporada, saturant la part superior de la taula només amb aquests partits.

Vaig assignar un valor de cLI de 36 a un setè partit de les Sèries Mundials, tenint en compte que el cLI més alt registrat per a un partit de temporada regular a Baseball Reference (des del 2016) va ser de 13,51. Aquest partit, el Texas a Seattle del 30 de setembre del 2023 (últim partit de la temporada regular), va tenir un gran impacte: Seattle podria haver guanyat el títol de divisió, però amb la derrota va quedar fora de les rondes eliminatòries.

Ara, el cLI forma part del càlcul del BWRI. És el segon factor més important, només darrere del Win Probability Added (WPA).

L’impacte del cLI és evident en les puntuacions del BWRI. Els tres millors partits des del 2016 són ara de les World Series:

  1. Dodgers at Rays, Game 4, 2020
  2. Dodgers at Astros, Game 5, 2017
  3. Cubs at Indians, Game 7, 2016

Aquí tens una comparació de les classificacions anteriors i noves per a alguns partits destacats del 2024:

PartitClassificació anteriorNova classificació
NYY at LA, WS, Game 5#370#1
NYM at ATL, 30 set (1)#28#4
CLE at DET, DS, Game 4#117#5
NYY at CLE, CS, Game 4#53#7
DET at CLE, DS, Game 5#349#8

Espero que gaudiu d’aquesta nova funcionalitat.

Els millors partits de beisbol del 2022 segons el BWRI

L’actualització del 2022 del Baseball Worth Rewatch Index ja està llesta. Utilitzant les dades jugada per jugada de Retrosheet, l’algorisme classifica els partits més emocionants de la temporada segons paràmetres com ara el resultat inesperat, quantitat total de probabilitat de guanyar afegida, qualitat del pitching o rivalitat. Donem una ullada a la part alta de la llista d’aquest any. >>> “Els millors partits de beisbol del 2022 segons el BWRI”

BWRI: un índex per a remirar bons partits de beisbol mentre no comença la temporada

Resum

Les ganes de veure beisbol durant la ‘offseason’ de la MLB m’han portat a crear un índex que ajuda a escollir quin partit mirar sense saber res més que els equips i el dia. Utilitzant R, vaig desenvolupar un algorisme que es fixa en els canvis en la probabilitat de guanyar jugada a jugada, per poder descobrir els partits més interessants. El 2024 vaig migrar el sistema de R a Python, i també vaig canviar de font de dades, de Retrosheet a Savant.

El codi també té en compte el bon ‘pitching’, les situacions de ‘no-hitter’, la rivalitat i les bones jugades defensives a l’outfield, per obtenir una combinació de diferents tipus de partits interessants. BWRI és una classificació normalitzada de 0 a 100, de manera que 100 és el partit més emocionant detectat per l’algoritme i 0 el pitjor, però no es tracta d’un índex de percentils.

El web inclou les temporades de 2016 en endavant. Pots consultar els BWRIs en mode de llista si vols, però el meu suggeriment és utilitzar el mode aleatori, filtrant per a partits amb una puntuació > 0.60, el que ve a ser una selecció similar a escollir el millor partit de cada setmana. BWRI no té en compte el context de la temporada, però pots filtrar que es mostrin només els partits de la postemporada.

El partit més interessant dels playoffs des del 2016 fins al 2024 segons el BWRI

A fons

Les offseasons són massa llargues. No m’agrada gaire seguir el mercat de ‘trades’ i l’agència lliure, així que en general passo els dies mirant partits de la temporada passada, amb ganes de descobrir ‘relievers’ o simplement divertint-me amb partits emocionants. No és ni la meitat de divertit si es coneix per endavant el resultat del partit, però això no és difícil, ja que hi ha més de 2,400 partits en una temporada regular normal de la MLB. A vegades veig partits aleatoris, però després vaig trobar baseballrewatch.com, i això em va salvar durant el confinament de la Covid. Desafortunadament, el lloc web fa temps que no s’actualitza.

Va ser llavors quan vaig pensar si seria possible fer un índex per avaluar si val la pena veure un partit passat, simplement usant les estadístiques play by play del partit. Utilitzant les dades de Retrosheet i els coneixements de Albert, Marchi i Baumer, vaig poder preparar fàcilment l’eina bàsica per calcular l’índex: la probabilitat de guanyar afegida (WPA) jugada a jugada, és a dir, com la probabilitat de guanyar un partit canvia després de cada jugada. Avui en dia el càlcul probabilístic el trec directament de les dades de Statcast, no el cuino.

El WPA és l’eina principal feta servir per crear el que he anomenat Baseball Worth Rewatch Index (BWRI), tot i que hi ha altres coses que he tingut en compte.

WPA Total

El primer que vaig pensar va ser: si sumo els valors canvis de probabilitat absoluts de cada jugada en un partit, les xifres més altes han d’assenyalar partits emocionants. Partits que van passar de les mans d’un equip a les d’un altre diverses vegades. Drama, situacions de ‘leverage’ i entreteniment, especialment en les últimes entrades, quan un canvi en el marcador genera un valor més alt de WPA. Així doncs, el primer factor de BWRI és el WPA Total.

Pitching

No tot són carreres i acció, els partits amb bon ‘pitching’ són realment divertits, el BWRI l’avalua de dues formes senzilles. En primer lloc, quants Ks per entrada hi ha en un joc i com d’a prop està un partit de ser un no-hitter. Des dels partits que arriben a la setena sense hits fins als no-hitters, tots obtenen punts extra. S

Bones jugades defensives

Mitjançant els càlculs de ‘catch probability’ de Statcast afegeixo punts a un partit si en aquest hi han hagut jugades defensives de 4, 5 o 6 estrelles.

Rivalitat

Finalment, afegeixo alguns punts extra per a partits amb rivalitat, per a aquest propòsit utilitzo dades de knowrivalry.com.

Altres característiques

Una cosa amb la qual em vaig trobar és que els partits amb extrainnings acumulaven fàcilment més valor i ocupaven gairebé sempre els primers llocs de la llista. Per compensar això multiplico per 0.95 els partits amb 10 innings, per 0.9 els d’11 i per 0.85 els de 12 en amunt.

Per últim, una altra cosa que vaig veure és que la distribució dels resultats era molt asimètrica. La majoria de partits quedaven a la franja d’entre 20 i 40 punts, i molt pocs superaven els 80. Per compensar una mica això vaig aplicar una potència de 0.5 a la sèrie, cosa que normalitza la distribució i acosta una mica més a 100 la nota dels partits més interessants.

www.rewatchbaseballindex.com

Els últims cinc minuts són una mina pel Madrid

Sense els últims 15 minuts de partit el Barça tindria 4 lligues més

Si sou culers aquesta escena us sonarà: surts del cine diumenge a la tarda, treus el mode avió del mòbil, i en algun dels teus grups de WhattsApp hi ha bullici. El Madrid no guanya i només falten 20 minuts. No les tens totes però entres en un bar, va que encara en traurem alguna cosa. Minut 75 i el Madrid no guanya, minut 80 i encara punxa, minut 85 i ja quasi ho tenim… però al final el gol cau, i te’n vas a casa emprenyat per un partit que no tenies previst veure. Que el Madrid sempre guanya a l’últim minut és un d’aquells mantres que tot aficionat del Barça ha recitat alguna vegada, però, què hi ha de real en aquesta percepció històrica dels culers? >>> “Els últims cinc minuts són una mina pel Madrid”

L’aficionat més tràgicament famós de Chicago viu amagat

La seva acció fa tretze anys va desfermar una polèmica que encara dura

La línia que separa l’espectador del jugador en el beisbol és terriblement fina. El camp no s’acaba amb les ratlles, i sovint els jugadors s’aboquen o entren a les grades per aconseguir una eliminació. El gol del beisbol és colpejar la pilota fins a fora del camp, i el somni de tot aficionat, recollir-la. Sense saber això no es pot entendre que una afició, i gairebé una ciutat sencera, puguin culpar un espectador d’una derrota del seu equip. Va passar l’octubre del 2003. Els Chicago Cubs eren a un pas d’arribar a la final de la lliga americana de beisbol per primer cop des d’un llunyà 1945. >>> “L’aficionat més tràgicament famós de Chicago viu amagat”

Avui és Opening Day: 5 claus i curiositats de la nova temporada de la MLB

Arizona farà servir un humidificador per reduir el nombre de ‘home runs’ al seu estadi

Deia Bill Veeck que només hi ha dues estacions: l’hivern i el beisbol. Avui s’acaba l’hivern i arrenca una nova temporada de la MLB nord-americana. Els últims participants de les World Series, Houston Astros i Los Angeles Dodgers, parteixen com a favorits en una temporada que també tindrà els Yankees, els Cubs i els Nationals entre els aspirants al títol. >>> “Avui és Opening Day: 5 claus i curiositats de la nova temporada de la MLB”

Perquè és millor apostar per la sorpresa que pel favorit

Les cases d’apostes cobren una comissió força més alta per apostar si s’opta per un favorit que si s’aposta a una sorpresa relativa

Amb una simple recerca a la xarxa es troben mil referències sobre com ho fan les cases d’apostes per guanyar diners, independentment de quins siguin els resultats dels partits. Ho fan de diverses maneres, però la més bàsica és senzilla d’entendre: et cobren una espècie de comissió cada cop que apostes, una comissió que ja està inclosa quan t’ofereixen la quota que se’t pagarà si guanyes l’aposta. >>> “Perquè és millor apostar per la sorpresa que pel favorit”

La influència dels àrbitres en el factor camp

Els àrbitres xiulen gairebé les mateixes faltes als equips locals que als visitants, però als jugadors de fora els ensenyen més targetes grogues i vermelles.

Acabàvem l’anterior post citant a un dels referents d’aquest blog, el llibre: Scorecasting: The hidden influences behind how sports are played and games are won. Un dels estudis que se citen en el llibre el van fer dos economistes espanyols, que l’any 2005 van pretendre comprovar com la pressió social influeix en les decisions humanes. Luis Garicano i Ignacio Palacios-Huerta van comptar els minuts de descompte que afegien els àrbitres a la lliga espanyola, tenint en compte el resultat del partit al minut 90. >>> “La influència dels àrbitres en el factor camp”

Jugar a casa ja no és l’avantatge que era

Anàlisi de tots els partits de les cinc grans lligues europees de futbol des del 1970 fins a l’actualitat: a la dècada dels 70 els equips de casa guanyaven gairebé el 70% dels punts, en els últims anys la dada ha arribat a baixar del 60%.

Per encetar el blog recupero un article que vaig publicar l’agost de 2015 al diari ARA. Un estudi sobre els resultats a les 5 grans lligues del futbol europeu, fet a partir d’una base de dades que vaig construir amb datasets del portal football-data.co.uk. L’he dividit en dues parts. Aquí va la primera: >>> “Jugar a casa ja no és l’avantatge que era”