L’actualització del 2022 del Baseball Worth Rewatch Index ja està llesta. Utilitzant les dades jugada per jugada de Retrosheet, l’algorisme classifica els partits més emocionants de la temporada segons paràmetres com ara el resultat inesperat, quantitat total de probabilitat de guanyar afegida, qualitat del pitching o rivalitat. Donem una ullada a la part alta de la llista d’aquest any. >>> “Els millors partits de beisbol del 2022 segons el BWRI”
Categoria: Esports
BWRI: un índex per a remirar bons partits de beisbol mentre no comença la temporada
Resum
Les ganes de veure beisbol durant la ‘offseason’ de la MLB m’han portat a crear un índex que ajuda a escollir quin partit mirar sense saber res més que els equips i el dia. Utilitzant R, vaig desenvolupar un algorisme que es fixa en els canvis en la probabilitat de guanyar jugada a jugada, per poder descobrir els partits més interessants. El 2024 vaig migrar el sistema de R a Python, i també vaig canviar de font de dades, de Retrosheet a Savant.
El codi també té en compte el bon ‘pitching’, les situacions de ‘no-hitter’, la rivalitat i les bones jugades defensives a l’outfield, per obtenir una combinació de diferents tipus de partits interessants. BWRI és una classificació normalitzada de 0 a 100, de manera que 100 és el partit més emocionant detectat per l’algoritme i 0 el pitjor, però no es tracta d’un índex de percentils.
El web inclou les temporades de 2016 en endavant. Pots consultar els BWRIs en mode de llista si vols, però el meu suggeriment és utilitzar el mode aleatori, filtrant per a partits amb una puntuació > 0.60, el que ve a ser una selecció similar a escollir el millor partit de cada setmana. BWRI no té en compte el context de la temporada, però pots filtrar que es mostrin només els partits de la postemporada.
A fons
Les offseasons són massa llargues. No m’agrada gaire seguir el mercat de ‘trades’ i l’agència lliure, així que en general passo els dies mirant partits de la temporada passada, amb ganes de descobrir ‘relievers’ o simplement divertint-me amb partits emocionants. No és ni la meitat de divertit si es coneix per endavant el resultat del partit, però això no és difícil, ja que hi ha més de 2,400 partits en una temporada regular normal de la MLB. A vegades veig partits aleatoris, però després vaig trobar baseballrewatch.com, i això em va salvar durant el confinament de la Covid. Desafortunadament, el lloc web fa temps que no s’actualitza.
Va ser llavors quan vaig pensar si seria possible fer un índex per avaluar si val la pena veure un partit passat, simplement usant les estadístiques play by play del partit. Utilitzant les dades de Retrosheet i els coneixements de Albert, Marchi i Baumer, vaig poder preparar fàcilment l’eina bàsica per calcular l’índex: la probabilitat de guanyar afegida (WPA) jugada a jugada, és a dir, com la probabilitat de guanyar un partit canvia després de cada jugada. Avui en dia el càlcul probabilístic el trec directament de les dades de Statcast, no el cuino.
El WPA és l’eina principal feta servir per crear el que he anomenat Baseball Worth Rewatch Index (BWRI), tot i que hi ha altres coses que he tingut en compte.
WPA Total
El primer que vaig pensar va ser: si sumo els valors canvis de probabilitat absoluts de cada jugada en un partit, les xifres més altes han d’assenyalar partits emocionants. Partits que van passar de les mans d’un equip a les d’un altre diverses vegades. Drama, situacions de ‘leverage’ i entreteniment, especialment en les últimes entrades, quan un canvi en el marcador genera un valor més alt de WPA. Així doncs, el primer factor de BWRI és el WPA Total.
Pitching
No tot són carreres i acció, els partits amb bon ‘pitching’ són realment divertits, el BWRI l’avalua de dues formes senzilles. En primer lloc, quants Ks per entrada hi ha en un joc i com d’a prop està un partit de ser un no-hitter. Des dels partits que arriben a la setena sense hits fins als no-hitters, tots obtenen punts extra. S
Bones jugades defensives
Mitjançant els càlculs de ‘catch probability’ de Statcast afegeixo punts a un partit si en aquest hi han hagut jugades defensives de 4, 5 o 6 estrelles.
Rivalitat
Finalment, afegeixo alguns punts extra per a partits amb rivalitat, per a aquest propòsit utilitzo dades de knowrivalry.com.
Altres característiques
Una cosa amb la qual em vaig trobar és que els partits amb extrainnings acumulaven fàcilment més valor i ocupaven gairebé sempre els primers llocs de la llista. Per compensar això multiplico per 0.95 els partits amb 10 innings, per 0.9 els d’11 i per 0.85 els de 12 en amunt.
Per últim, una altra cosa que vaig veure és que la distribució dels resultats era molt asimètrica. La majoria de partits quedaven a la franja d’entre 20 i 40 punts, i molt pocs superaven els 80. Per compensar una mica això vaig aplicar una potència de 0.5 a la sèrie, cosa que normalitza la distribució i acosta una mica més a 100 la nota dels partits més interessants.
Els últims cinc minuts són una mina pel Madrid
Sense els últims 15 minuts de partit el Barça tindria 4 lligues més
Si sou culers aquesta escena us sonarà: surts del cine diumenge a la tarda, treus el mode avió del mòbil, i en algun dels teus grups de WhattsApp hi ha bullici. El Madrid no guanya i només falten 20 minuts. No les tens totes però entres en un bar, va que encara en traurem alguna cosa. Minut 75 i el Madrid no guanya, minut 80 i encara punxa, minut 85 i ja quasi ho tenim… però al final el gol cau, i te’n vas a casa emprenyat per un partit que no tenies previst veure. Que el Madrid sempre guanya a l’últim minut és un d’aquells mantres que tot aficionat del Barça ha recitat alguna vegada, però, què hi ha de real en aquesta percepció històrica dels culers? >>> “Els últims cinc minuts són una mina pel Madrid”
L’aficionat més tràgicament famós de Chicago viu amagat
La seva acció fa tretze anys va desfermar una polèmica que encara dura
La línia que separa l’espectador del jugador en el beisbol és terriblement fina. El camp no s’acaba amb les ratlles, i sovint els jugadors s’aboquen o entren a les grades per aconseguir una eliminació. El gol del beisbol és colpejar la pilota fins a fora del camp, i el somni de tot aficionat, recollir-la. Sense saber això no es pot entendre que una afició, i gairebé una ciutat sencera, puguin culpar un espectador d’una derrota del seu equip. Va passar l’octubre del 2003. Els Chicago Cubs eren a un pas d’arribar a la final de la lliga americana de beisbol per primer cop des d’un llunyà 1945. >>> “L’aficionat més tràgicament famós de Chicago viu amagat”
Avui és Opening Day: 5 claus i curiositats de la nova temporada de la MLB
Arizona farà servir un humidificador per reduir el nombre de ‘home runs’ al seu estadi
Deia Bill Veeck que només hi ha dues estacions: l’hivern i el beisbol. Avui s’acaba l’hivern i arrenca una nova temporada de la MLB nord-americana. Els últims participants de les World Series, Houston Astros i Los Angeles Dodgers, parteixen com a favorits en una temporada que també tindrà els Yankees, els Cubs i els Nationals entre els aspirants al títol. >>> “Avui és Opening Day: 5 claus i curiositats de la nova temporada de la MLB”
Perquè és millor apostar per la sorpresa que pel favorit
Les cases d’apostes cobren una comissió força més alta per apostar si s’opta per un favorit que si s’aposta a una sorpresa relativa
Amb una simple recerca a la xarxa es troben mil referències sobre com ho fan les cases d’apostes per guanyar diners, independentment de quins siguin els resultats dels partits. Ho fan de diverses maneres, però la més bàsica és senzilla d’entendre: et cobren una espècie de comissió cada cop que apostes, una comissió que ja està inclosa quan t’ofereixen la quota que se’t pagarà si guanyes l’aposta. >>> “Perquè és millor apostar per la sorpresa que pel favorit”
La influència dels àrbitres en el factor camp
Els àrbitres xiulen gairebé les mateixes faltes als equips locals que als visitants, però als jugadors de fora els ensenyen més targetes grogues i vermelles.
Acabàvem l’anterior post citant a un dels referents d’aquest blog, el llibre: Scorecasting: The hidden influences behind how sports are played and games are won. Un dels estudis que se citen en el llibre el van fer dos economistes espanyols, que l’any 2005 van pretendre comprovar com la pressió social influeix en les decisions humanes. Luis Garicano i Ignacio Palacios-Huerta van comptar els minuts de descompte que afegien els àrbitres a la lliga espanyola, tenint en compte el resultat del partit al minut 90. >>> “La influència dels àrbitres en el factor camp”
Jugar a casa ja no és l’avantatge que era
Anàlisi de tots els partits de les cinc grans lligues europees de futbol des del 1970 fins a l’actualitat: a la dècada dels 70 els equips de casa guanyaven gairebé el 70% dels punts, en els últims anys la dada ha arribat a baixar del 60%.
Per encetar el blog recupero un article que vaig publicar l’agost de 2015 al diari ARA. Un estudi sobre els resultats a les 5 grans lligues del futbol europeu, fet a partir d’una base de dades que vaig construir amb datasets del portal football-data.co.uk. L’he dividit en dues parts. Aquí va la primera: >>> “Jugar a casa ja no és l’avantatge que era”