Learn a Stat: Box Plus Minus e VORP

Bentornati su Hack a Stat! In questo capitolo di Learn a Stat, che è anche l’ultimo (per ora), andremo alla scoperta di Box Plus Minus e VORP.

Introduzione

Il Box Plus-Minus è un’altra statistica all-in-one che cerca di far convergere in un unico numero tutti i contributi di un giocatore. Nasce dalla volontà di Daniel Myers di creare una statistica dalle caratteristiche simili al PER o al Win Share, ma che avesse la forma di plus-minus. In altre parole il numero (positivo o negativo) ci permette di capire l’impatto del giocatore in campo, calcolato tramite i box score.
Nonostante il BMP possa essere calcolato direttamente, sono anche ricavabili l’Offensive Box Plus Minus (OBPM) e il Defensive Box Plus Minus (DBPM): come suggeriscono i nomi, la prima statistica fa riferimento alla sola parte offensiva del giocatore, mentre la seconda alla fase difensiva. Per la natura dei tabellini è facile intuire che l’OBPM si basi su dati solidi che coprono tutti i vari aspetti di gioco offensivo e che quindi sia piuttosto affidabile; non si può dire lo stesso per il DBPM, dato che diversi contributi difensivi non vengono contabilizzati. Il Defensive Box Plus-Minus è perciò meno affidabile della sua controparte offensiva.

Il VORP invece è l’acronimo di Value Over Replacement Player ed è una statistica dipendente dal BPM: si prende il valore di quest’ultima per creare un scala di valutazione univoca per la Lega in cui il Replacement Player (ovvero il giocatore di riferimento) sarà il campione che determinerà il valore base.

Definizione e dati di partenza

Il Box Plus Minus ci permette di comprendere l’impatto di un giocatore in campo in termini di margine di punti (positivi o negativi) ripartiti su 100 possessi. L’Offensive e il Defensive hanno significato equivalente, ma fanno riferimento al solo impatto offensivo e difensivo. Come si diceva precedentemente, il Box Plus Minus si calcola a partire dai dati ricavabili da un normale box score, anche se in realtà si sfrutteranno le statistiche avanzate relative ai classici valori del box score.

Il VORP converte il valore del Box Plus Minus in una stima del contributo del giocatore, la quale è parametrizzata rispetto al Replacement Player, ovvero un giocatore di riferimento. In questo caso il valore di riferimento è -2 (ovvero il BPM del Replacement Player). Otterremo quindi una scala di confronto univoca, il cui valore soglia sarà 0 (ovvero il VORP del Replacement Player): un VORP maggiore di 0 sarà positivo, uno minore identificherà un giocatore che sta giocando male.

Entrambe le statistiche si basano su valori stagionali.

Per calcolare queste statistiche avremo bisogno di un po’ di dati.

Box Plus Minus

VORP

  • Box Plus Minus [BPM];
  • Minuti giocati [MP];
  • Minuti giocati di squadra [TeMP];
  • Partite giocate di squadra [TeGP];

Formule e procedura di calcolo

Box Plus Minus

Come per il PER, il BPM si calcola sommando i diversi contributi del giocatore in modo da ottenere un valore grezzo, gBMP, che verrà poi tarato sulle prestazioni di squadra per ottenere il vero Box Plus Minus. Ogni singolo addendo che compone il termine grezzo è relativo ad uno o più contributi; inoltre vi è sempre un fattore correttivo, il cui valore è stato ottimizzato nel tempo.

NB1: È di recente uscita un aggiornamento del BPM; con buona probabilità il lavoro fatto ha coinvolto i fattori correttivi, modificandoli. Appena saranno resi pubblici, provvederò ad aggiornare questo Learn a Stat.

NB2: dove non specificato, i valori saranno da utilizzare come solitamente visualizzati (es: TR% di 25, nella formula si utilizzerà 25).

Il primo termine prende in considerazione i minuti giocati:

\boldsymbol{gBPM_1=a\cdot \frac{MP}{GP+2}}

\boldsymbol{a=0,123391}

Dietro al primo termine c’è un piccolo ragionamento da fare: volendo confrontare i BPM di ogni giocatore ci si può imbattere in giocatori sia di alto che di basso minutaggio. Tendenzialmente quelli ad alto minutaggio avranno affrontato momenti di partita più critici dei secondi. Per dare quindi maggiore peso ai primi si è deciso di aggiungere quattro partite da 0 minuti nel calcolo della media. Si prendono quindi i minuti totali e si dividono per il numero di partite giocate più quattro: questo valore è stato settato da Myers per quanto riguarda la NBA. Per le statistiche che calcolo io per serie A, Eurolega e Eurocup ho deciso di aggiungere invece due partite da 0 minuti, dato che il numero totale di incontri è decisamente inferiore (30/34 partite stagionali contro 82).

I successivi termini sono inerenti ai rimbalzi offensivi e difensivi:

\boldsymbol{gBPM_2=b\cdot OR\%}

\boldsymbol{gBPM_3=c\cdot DR\%}

\boldsymbol{b=0,119597}

\boldsymbol{c=-0,151287}

Il quarto e il quinto sono relativi alle palle rubate e alle stoppate:

\boldsymbol{gBPM_4=d\cdot ST\%}

\boldsymbol{gBPM_5=e\cdot BLK\%}

\boldsymbol{d=1,255644}

\boldsymbol{e=0,531838}

Il sesto prende in considerazione gli assist, mentre il successivo le palle perse:

\boldsymbol{gBPM_6=f\cdot Ast\%}

\boldsymbol{gBPM_7=g\cdot Usg\%\cdot TO\%}

\boldsymbol{f=-0,305868}

\boldsymbol{g=0,921292}

La percentuale di palle perse è moltiplicata per l’Usage in modo da considerarla sui possessi di squadra (come già avviene per ST% e BLK%), dato che il TO% (o TO Ratio) è calcolato sui possessi individuali.
NB: il TO% deve essere utilizzato come valore puro e non percentuale (es: TO% di 25, utilizzo 0,25).

Il termine successivo è relativo alla produzione offensiva e si discosta dai precedenti per la loro linearità:

\boldsymbol{gBPM_8=h\cdot Usg\%\cdot (1-TO\%)\cdot \left [ 2\cdot (TS\%+TmTS\%)+i\cdot Ast\%+j\cdot (\%3P-Lg\%3P) -k\right ]}

\boldsymbol{h=0,711217}

\boldsymbol{i=0,017022}

\boldsymbol{j=0,297639}

\boldsymbol{k=0,213485}

Andiamo con ordine: la prima parte calcola i possessi individuali conclusi con un tiro o un assist (1 – TO% fornisce esattamente questo) e gli ridistribuisce sui possessi di squadra tramite l’Usage. La seconda parte calcola la produzione offensiva del giocatore a partire dalla sua percentuale reale e la confronta con quella di squadra: in questo modo un giocatore dalle ottime percentuali in una squadra con percentuali orribili risalterà di uno con stessa percentuale ma che milita in squadra con TS% migliore. Abbiamo poi un termine relativo agli assist e infine un termine relativo alla frequenza di tiri da 3 punti tentati dal giocatore, confrontato con quello di Lega.
NB: anche in questo caso il TO% deve essere utilizzato come valore puro e non percentuale, così come la percentuale di tiri da 3 tentati e le percentuali di tiro.

L’ultimo termine della formula è abbastanza strano a vedersi:

\boldsymbol{gBPM_9=l\cdot \sqrt{Ast\%\cdot TR\%}}

\boldsymbol{l=0,725930}

Moltiplica due termini che non hanno grossa attinenza assieme, ovvero rimbalzi totali e assist: in realtà tale termine cerca di premiare i giocatori all-around, ovvero quei giocatori che fanno di tutto in campo. L’esempio più lampante è Westbrook, ad esempio; in buona sostanza questo termine premia i giocatori da tripla doppia.

Sommando tutti i termini presentati si ottiene il Box Plus Minus grezzo (attenzione al settimo termine, che va sottratto):

\boldsymbol{gBPM=gBPM_1+gBPM_2+gBPM_3+gBPM_4+gBPM_5+gBPM_6-gBPM_7+gBPM_8+gBPM_9}

Per ottenere il valore puro è necessario calcolare un coefficiente correttivo di squadra [TeAdC]; ogni squadra avrà quindi un valore differente. La formula per il suo calcolo è la seguente:

\boldsymbol{TeAdC=\frac{TmNetRtg\cdot 1,20-\sum_{i=1}^{n}\left ( \frac{5\cdot MP_i}{TeMP}\cdot gBPM_i\right )}{5}}

Per il coefficiente di 1,20, Myers afferma che squadre con Net Rtg positivo (quindi solitamente in vantaggio nella partita) giocano leggermente al di sotto delle loro potenzialità, mentre quelle con Net Rtg negativo (quindi solitamente in svantaggio) giocano leggermente al di sopra delle loro potenzialità (per via degli sforzi nel tentativo di recuperare). Myers ha voluto quindi tenere conto di questo aspetto nel calcolo di TeAdC: quel 1,20 non fa altro che aumentare del 20% i Net Rating positivi e diminuire del 20% quelli negativi in modo da considerare questo particolare aspetto di gioco. Il 20% è il valore scelto per scalare i Net Rating.

I Net Rating utilizzati nei BPM NBA sono corretti (o adjusted): tengono quindi conto del diverso calendario di ogni squadra. Come sapete le franchigie NBA affrontano un numero maggiore di volte squadre della stessa conference rispetto a quelle dell’altra. Attualmente un Net Rtg di +8 nella West risulta migliore di un +8 nella East, perché sappiamo che il lato occidentale vi sono più squadre di alto livello. Gli analisti correggono quindi i Rating per tener conto di tutto ciò.
Nel nostro campionato, così come in Eurolega, tale problematica non è presente. Possiamo quindi utilizzare senza problemi i normali Net Rating.

Troviamo poi la somma dei BPM grezzi moltiplicati per la percentuali di minuti giocati da ogni giocatore.

Infine, la differenza tra Net Rating e somma di percentuale di minuti e BPM grezzo viene divisa per 5 per distribuire il valore sui cinque giocatori che compongono le line-up. Tale coefficiente può essere positivo o negativo a seconda delle prestazioni di squadra.

Il passo finale è quindi quello di sommare il BPM grezzo con il coefficiente correttivo di squadra per ottenere il Box Plus Minus.

\boldsymbol{BPM=gBPM+TeAdC}

Il risultato potrà essere positivo o negativo a seconda delle prestazioni del giocatore.

Offensive Box Plus Minus

Il calcolo del BPM offensivo è identico al calcolo del Box Plus Minus. Le differenze si trovano nei coefficienti (hanno tutti diverso valore) e nel coefficiente correttivo di squadra. In questo caso non si utilizzerà più il Net Rating ma la differenza tra Offensive Rating della squadra e quello medio di lega.

\boldsymbol{TeAdC=\frac{(TmOffRtg-LgOffRtg)\cdot 1,20-\sum_{i=1}^{n}\left ( \frac{5\cdot MP_i}{TeMP}\cdot gBPM_i\right )}{5}}

\boldsymbol{a=0,064448}

\boldsymbol{b=0,211125}

\boldsymbol{c=-0,107545}

\boldsymbol{d=0,346513}

\boldsymbol{e=-0,052476}

\boldsymbol{f=-0,041787}

\boldsymbol{g=0,932965}

\boldsymbol{h=0,687359}

\boldsymbol{i=0,007952}

\boldsymbol{j=0,374706}

\boldsymbol{k=-0,181891}

\boldsymbol{l=0,239862}

Basta quindi seguire la procedura di calcolo del BPM, avendo l’accortezza di sostituire i valori dei coefficienti, per ricavare il valore offensivo.

Defensive Box Plus Minus

Questo ultimo BPM si calcolerà con la semplice sottrazione tra il Box Plus Minus e l’Offensive Box Plus Minus, dato che banalmente la somma dei contributi offensivi e difensivi formano il contributo totale dato da un giocatore.

\boldsymbol{DBPM=BPM-OBPM}

VORP

Il Value Over Replacement Player è anch’esso semplice da ottenere:

\boldsymbol{VORP=\left [ BPM-(-2)) \right ]\cdot \frac{5\cdot MP}{TeMP}\cdot \frac{TeGP}{LgGP}}

Detto che il valore di BPM scelto per il giocatore di riferimento è -2, si calcola la distanza tra tale giocatore e quello in analisi con la prima sottrazione, quindi si moltiplica il risultato per la percentuale di minuti giocati e il rapporto tra le partite disputate dalla squadra e il numero totale di partite da giocare (82 per la NBA, 30 o 34 per serie A e Eurolega).

Lettura e usi

Prendiamo due squadre e analizziamo i BPM dei vari giocatori: Eurolega 2017/2018, Efes e Real Madrid. Ecco i Box Plus Minus dei giocatori e alcuni valori intermedi.

Alcuni giocatori hanno un contributo grezzo positivo, ma il coefficiente correttivo (negativo per entrambe le squadre) porta ad avere un Box Plus Minus negativo: in altre parole, seppur alcuni giocatori abbiano mediato cifre consistenti, dovendo anche tener conto delle prestazioni di squadra si ottengono valori finali negativi. Tra le file della squadra di Istanbul nessun giocatore ha un BPM positivo: idealmente ha senso, dato che l’Efes è stata la squadra con il peggior record di quella stagione.

Nel Real invece troviamo diversi giocatori con BPM positivo: Doncic, il migliore in questa classifica, ma anche Fernandez, Randolph, Ayon, Campazzo, Thompinks e Tavares. Abbiamo poi alcuni giocatori con Box Plus Minus attorno alla cifra nulla: come potete intuire, mediare un BPM positivo non è così facile. Avere un valore attorno allo 0 significa essere un giocatore nella media, quindi uno che porta il suo contributo alla causa di squadra. Un contributo negativo inizia ad essere riscontrabile attorno al valore -2, ovvero il famoso valore del giocatore di riferimento. Al di sotto di esso troviamo quindi prestazioni controproducenti per il gioco di squadra. Giocatori come Causeur o Randle risultano quindi positivi.

Se invece volessimo osservare la parte offensiva ecco cosa otteniamo:

Ci troviamo una situazione molto simile alla precedente. In questa situazione giocatori molto offensivi come McCollum riescono a ottenere valori positivi (o comunque maggiori di -2) anche in squadre di bassissima classifica.

Sottraendo l’OBPM al BPM possiamo ottenere il DBPM: come già detto è il termine meno attendibile dei tre, proprio perché non si basa su tutti i contributi difensivi possibili, ma solo su quelli ottenibili dal box score. Questo è un difetto di non poco conto, che deve essere sempre considerato quando si parla di Box Plus Minus.

Infine il VORP:

Il VORP ci permette di saltare il ragionamento fatto precedentemente: il Box Plus Minus di Causeur, ad esempio, è pari a -0,8; ciò vuol dire che ha contribuito in maniera positiva o negativa alla causa del Real? Il suo valore è maggiore di -2 (il valore di riferimento), quindi ha dato un piccolo contributo positivo. Il VORP permette di saltare questo piccolo confronto numerico, stimando direttamente il posizionamento di Fabien rispetto al livello soglia di -2.
Inoltre il VORP prende in considerazione i minuti giocati, riducendo quindi i BPM dei giocatori utilizzati poco. Per esempio McCollum e Balbay hanno BPM praticamente uguali, ma minutaggi nettamente differenti. Tale fatto non è riscontrabile direttamente tramite Box Plus Minus, ma con il VORP constatiamo subito che l’americano, avendo giocato di più, ha contribuito in maniera più consistente alle prestazioni di squadra.

In conclusione possiamo dire che il BPM è una statistica avanzata affascinante, ma bisogna conoscere i suoi limiti per poterlo utilizzare intelligentemente. Il VORP invece è una statistica utile per avere una prima indicazione di quali siano i migliori giocatori della lega.

È tutto alla prossima, il vostro amichevole Cappe di quartiere.

Lascia un commento