BWRI: un índex per a remirar bons partits de beisbol mentre no comença la temporada

Design by Idoia Vallverdú

Resum

Les ganes de veure beisbol durant la ‘offseason’ de la MLB m’han portat a crear un índex que ajuda a escollir quin partit mirar sense saber res més que els equips i el dia. Utilitzant R, he desenvolupat un algorisme que es fixa en els canvis en la probabilitat de guanyar jugada a jugada, per poder descobrir els partits més interessants.

El codi també té en compte el bon ‘pitching’, les situacions de ‘no-hitter’, els ‘walkoffs’ i la rivalitat, per obtenir una combinació de diferents tipus de partits interessants. BWRI és una classificació percentual, de manera que 1 és el partit més emocionant detectat per l’algoritme i 0 el pitjor. BWRI inclou les temporades de 2011 a 2020. Pots aprofundir en BWRI en mode de llista si vols, però el meu suggeriment és utilitzar el mode aleatori, filtrant per a partits amb una puntuació > 0.95, el que ve a ser una selecció similar a escollir el millor partit de cada jornada. BWRI no té en compte el context de la temporada, però pots filtrar que es mostrin només els partits de la postemporada.

A fons

Les offseasons són massa llargues. No m’agrada gaire seguir el mercat de trades i l’agència lliure, així que en general passo el temps veient partits de la temporada passada, amb ganes de descobrir ‘relievers’ o simplement divertint-me amb partits emocionants. No és ni la meitat de divertit si es coneix per endavant el resultat del partit, però això no és difícil, ja que hi ha més de 2,400 partits en una temporada regular normal de MLB. A vegades veig partits aleatoris, però després vaig trobar baseballrewatch.com, i això em va salvar durant el confinament de primavera. Desafortunadament, el lloc web no s’ha actualitzat per a la temporada 2020.

Va ser llavors quan vaig pensar si seria possible fer un índex per avaluar si val la pena veure un partit passat, simplement usant les estadístiques play by play del partit. Utilitzant les dades de Retrosheet i els coneixements de Albert, Marchi i Baumer, vaig poder preparar fàcilment l’eina bàsica per calcular l’índex: la probabilitat de guanyar afegida (WPA) jugada a jugada, és a dir, com la probabilitat de guanyar un partit canvia després de cada jugada. Aquesta és l’eina principal feta servir per crear el que he anomenat Baseball Worth Rewatch Index (BWRI), tot i que hi ha altres coses que he tingut en compte.

WPA Total

El primer que vaig pensar va ser: si sumo els valors WPA absoluts de cada jugada en un partit, les xifres més altes han d’assenyalar partits emocionants. Partits que van passar de les mans d’un equip a les d’un altre diverses vegades durant el joc. Drama, situacions de ‘leverage’ i entreteniment, especialment en les últimes entrades, quan un canvi en el marcador genera un valor més alt de WPA. Així doncs, el primer factor de BWRI és el WPA Total, però, li vaig fer alguns ajustaments.

El principal problema és el “soroll” que generen les jugades poc importants. En partits igualats, qualsevol jugada menor afegeix gairebé el doble de WPA que en partits amb 2 o 3 curses de diferència. Al final, un partit avorrit decidit a la vuitena entrada resultava tenir massa puntuació, així que vaig decidir fer servir només les jugades que canviaven la probabilitat de guanyar un 8% o més.

Dos exemples recents de WPA afegit: en el primer partit de les Sèries Mundials del 2020 els Dodgers anoten 4 carreres a la quarta entrada i 4 més a la cinquena, de manera que el partit obté un WPA Total baix. A l’altre costat de la balança, el quart partit de la sèrie obté un dels valors més alts de WPA Total dels últims 10 anys en postemporada.

I com a curiositat, aquí us ensenyo el partit amb la WPA total més alta des de 2011. És molt recent, cap al final de la temporada 2020 Atlanta guanya a Boston amb dues entrades extra. Es posa per davant amb 3 carreres en el vuitè, Boston empata amb 2 carreres en el novè, cada equip anota dues carreres en el desè, Boston n’afegeix una més en l’onzè, però Atlanta finalment guanya amb dos més i un walkoff. I ningú a les grades per viure-ho.

Final inesperat (Unexpected Ouctome UO)

És genial quan l’equip que ha estat perdent durant bona part del partit guanya al final. M’encanten aquest tipus de partits, i en general tenen un WPA Total baix, perquè durant la major part del joc l’equip que a la fi guanya va per darrere per un marge de 2 o més carreres. Al principi vaig pensar que seria tan fàcil com fer la mitjana de la probabilitat de guanyar i restar-la del valor final. Això va resultar ser insuficient, així que vaig decidir marcar la probabilitat de guanyar des de la setena entrada fins al final, i en els dos últims extrainnings, per detectar canvis tardans. L’indicador de final inesperat (UO) és una suma de tot això.

Pitching

No tot són carreres i acció, els partits amb bon ‘pitching’ són realment divertits, el BWRI l’avalua de dues formes senzilles. En primer lloc, quants Ks per entrada hi ha en un joc i com d’a prop està un partit de ser un no-hitter. Des dels partits que arriben a la setena sense hits fins als no-hitters, tots obtenen punts extra. Seria molt bo tenir en compte també les recepcions de baixa probabilitat, desafortunadament, crec que aquestes dades no estan disponibles per partit.

Partits igualats (Close games CG)

Així com m’agraden els finals inesperats, també està bé quan el partit és molt equilibrat. En aquest cas, s’obté la diferència entre la probabilitat de guanyar i 0.5 en cada jugada, i se suma el valor absolut de totes. Els valors baixos signifiquen partits igualats. Vaig pensar en això com un factor principal en un primer moment, però després vaig decidir mantenir-lo baix, ja que espatllava la puntuació BWRI d’alguns partits emocionants.

Walkoffs

També hi ha punts addicionals per walkoffs, la majoria d’ells ja tenen una qualificació alta en els indicadors principals, però un impuls addicional ajuda a ressaltar els finals feliços per als equips locals.

Rivalitat

Finalment, vaig afegir alguns punts extra per a partits amb rivalitat, per a aquest propòsit utilitzo dades de knowrivalry.com.

Altres característiques

Vaig decidir fer servir el WPA Total i l’UO en una puntuació Z, de manera que els partits molt desequilibrats no només no afegeixen, sinó que fins i tot resten valor al BWRI. D’altra banda, vaig assumir que el bon ‘pitching’ i tots els altres factors han de ser només valors positius i no disminuir la puntuació final. El BWRI no té en compte el context de la temporada, però es poden filtrar només els partits de postemporada o filtrar per mes.

Si us pregunteu quin és el pes de cada factor en la puntuació final del BWRI, la resposta és que per als 500 partits amb més puntuació, el pes del WPA Total és d’un 33%, el de l’UO del 32%, factor Ks 17%, partits igualats 8%, walkoffs 7%. La rivalitat és responsable de només una mica més del 2% i el factor de ‘no-hitter’ d’una mica menys del 2%.

En aquest gráfic hi ha els dos factors principals del BWRI, només amb partits de les últimes 10 postemporades. Tingueu en compte que la majoria dels partits tenen una mica de WPA Total, però molts no tenen una taxa d’UO. He destacat alguns dels que obtenen una puntuació alta. El punt més aïllat del gràfic és l’increïble final del quart partit de les Sèries Mundials 2020. El sisè partit de les WS 2011 també marca diferència, potser el recordaràs si dic un nom: David Freese. A la banda de l’UO, el més notable segons BWRI és la remuntada d’Oakland a la novena entrada en el quart partit de les ALCS 2012, seguit per la remuntada dels Cubs en el quart partit de les NLDS 2016. El setè partit de la Sèrie Mundial de 2016 també obté una puntuació BWRI > 0.8, però queda com el segon parit més emocionant d’aquell camí cap al títol dels Cubs.

Per a evaluar la probabilitat de guanyar jugada a jugada, he fet servir el mètode proposat por Max Marchi, Jim Albert y Benjami S. Baumer.

Espero que el gaudiu.

www.rewatchbaseballindex.com

Deixa un comentari

L'adreça electrònica no es publicarà. Els camps necessaris estan marcats amb *