Learn a Stat: Player Efficiency Rating (PER)

Bentornati su Hack a Stat! Questo nuovo capitolo di Learn a Stat è dedicato a una statistica avanzata tanto interessante quanto pericolosa: il Player Efficiency Rating, a.k.a. PER.

Introduzione

Per quanto l’uomo si sforzi, non è mai riuscito a resistere alla tentazione di classificare qualunque cosa nel modo più semplice possibile: sa che è impossibile ridurre tutto ad un’unica scala di valutazione, sa che è difficile considerare tutti gli aspetti e concentrali in un unico valore, sa che si andranno a perdere informazioni. Ma è più forte di lui, alla fine si sforzerà per cercare un metro unico per valutare una determinata cosa. Ecco, il PER è un perfetto esempio di questo aspetto della mentalità umana: cercare di quantificare in un unico valore tutti i contributi (positivi e negativi) di un giocatore.
Quindi il PER risulta sicuramente una statistica comoda e affascinante, ma al tempo stessa pericolosa: ci fornisce infatti una scala univoca di valutazione per i giocatori, ma facendo ciò diverse informazioni vengono perse o omesse.

Definizione e dati di partenza

PER sta per Player Efficiency Rating, ovvero la valutazione di efficienza di un giocatore. La nascita del PER la dobbiamo allo statista John Hollinger, che ha voluto evolvere la Valutazione di un giocatore ad un livello più dettagliato e preciso. Infatti il PER è la somma di tutti i contributi positivi e negativi di un giocatore, che tiene però conto dei minuti giocati e dalle prestazioni di tutti i giocatori della Lega. La statistica di Hollinger quindi prende il concetto di Valutazione (somma di tutti i contributi positivi e negativi) e lo migliora, creando una scala di confronto univoca: questo aspetto è fondamentale, dato che la Valutazione ci dà informazioni riguardo alla singola prestazione del giocatore, ma non tiene conto del diverso peso dei tanti contributi di gioco (un canestro realizzato ha un peso diverso da un assist o un rimbalzo), dei minuti di gioco del giocatore, del ritmo medio (Pace) di gioco e delle prestazioni degli altri giocatori.

Per calcolare il PER abbiamo quindi bisogno di molti dati. Iniziamo con quelle del singolo giocatore:

  • Minuti di gioco [MP];
  • Canestri dal campo realizzati [FGM] e tentati [FGA];
  • Tiri da 3 punti realizzati [3PM];
  • Tiri liberi realizzati [FTM] e tentati [FTA];
  • Assist [Ast];
  • Palle perse [TO];
  • Rimbalzi offensivi [OR] e difensivi [DR];
  • Palle rubate [ST];
  • Stoppate [BLK];
  • Falli fatti [PF];

Abbiamo poi la necessità di conoscere alcune statistiche di squadra:

  • Canestri dal campo di squadra realizzati [TeFGM];
  • Assist di squadra [TeAst];
  • Pace medio di squadra [TePace];

Infine abbiamo bisogno di statistiche di Lega, ovvero la somma o la media delle statistiche di tutte le squadre partecipanti:

  • Canestri dal campo di lega realizzati [LgFGM] e tentati [LgFGA];
  • Tiri liberi di lega realizzati [LgFTM] e tentati [LgFTA];
  • Assist di lega [LgAst];
  • Punti realizzati di lega [LgPts];
  • Rimbalzi offensivi di lega [LgOR];
  • Palle perse di lega [LgTO];
  • Pace medio di lega [LgPace];
  • Defensive Rebound Percentage di Lega [LgDR%];

Raccolti tutti questi dati possiamo procedere al calcolo.

Formule e procedura di calcolo

Il processo nel calcolo del PER si può dividere in tre parti distinte: una prima parte in cui si calcola il valore grezzo dell’efficienza del giocatore [gPER], una seconda parte in cui si va ad aggiustare tale valore con il ritmo di squadra, ottenendo così un PER corretto [cPER] ed infine una terza parte, dove avviene la ridistribuzione su scala univoca. Tra le tre, la più gravosa in termini di calcoli è la prima: avremo bisogno di diversi passaggi per ricavare il gPER e di alcuni coefficienti che tengono conto delle prestazioni di tutta la lega.

Per comodità di analisi dividiamo quindi il calcolo del PER grezzo in più parti, dodici per la precisione. Ogni parte ci fornirà il contributo del giocatore per una singola statistica. Prima di andarli ad analizzare, definiamo però tre coefficienti che ci serviranno nel corso del calcolo del gPER. Il primo è definito “Factor” da Hollinger:

\boldsymbol{Factor=\frac{2}{3}-\frac{0,5\cdot \frac{LgAst}{LgFGM}}{2\cdot \frac{LgFGM}{LgFTM}}}

Tale coefficiente prende in considerazione le prestazioni di tutta le lega e fornisce un valore che tiene conto dei canestri assistiti e di quante volte si va in lunetta. In questo modo si darà un diverso peso ai tiri dal campo realizzati dal giocatore in analisi. In pratica a fronte di molti tiri liberi ottenuti a livello di lega, un canestro dal campo avrà più peso, perché più raro. Nel caso invece ci siano molti assist ecco che i tiri dal campo perderanno un po’ di valore, perché giudicati leggermente più semplici. Si parla comunque di piccole variazioni rispetto al valore reale di tiri presi. Il secondo invece è il VOP, ovvero i punti realizzati per possesso:

\boldsymbol{VOP=\frac{LgPts}{LgFGA+0,44\cdot LgFTA-LgOR+LgTO}}

Questo secondo coefficiente ci tornerà utile per pesare alcuni aspetti di gioco. Infine il terzo è il nostro caro Defensive Rebound Percentage di lega.

Definiti questi tre coefficienti si può passare finalmente al calcolo del PER grezzo: partiamo quindi con il primo dei dodici termini che lo vanno a comporre.

\boldsymbol{gPER_{1}=\left (2-Factor\cdot \frac{TeAst}{TeFGM} \right )\cdot FGM}

Con questo primo termine si va a calcolare il peso statistico dei canestri dal campo realizzati: il due in parentesi indica i punti generati per ogni tiro dal campo realizzato (le triple verranno contabilizzate successivamente), ma tale valore viene ridotto per un coefficiente che tiene conto delle prestazioni di tiro di tutta la lega (tramite il termine Factor) e delle prestazioni di squadra. In questo modo a seconda dei casi, i tiri dal campo realizzati dal giocatore varranno più o meno, in base alle prestazioni di squadra e di lega.

Il secondo è semplicissimo invece:

\boldsymbol{gPER_{2}=3PM}

Si prendono quindi in considerazione le triple messe a segno dal giocatore, così che la difficoltà del tiro dalla lunga sia tenuta in considerazione.

Il terzo invece considera gli assist:

\boldsymbol{gPER_{3}=\frac{2}{3}\cdot Ast}

Si moltiplicano gli assist per un coefficiente 2/3, per dare un valore più piccolo ad un assist rispetto ad un canestro segnato.

Il quarto va a contabilizzare i tiri liberi:

\boldsymbol{gPER_{4}=FT\cdot 0,5\cdot \left [ 1+\left ( 1-\frac{TeAst}{TeFGM}+\frac{2}{3}\cdot \frac{TeAst}{TeFGM} \right ) \right ]}

Stesso discorso fatto per i tiri dal campo. Se per esempio in squadra e in lega si va poco in lunetta, i tiri liberi del singolo giocatore avranno un peso maggiore nel risultato finale.

I prossimi tre saranno termini che verranno poi contabilizzati come negativi; partiamo con il quinto:

\boldsymbol{gPER_{5}=VOP\cdot TO}

Un VOP alto può indicare due cose: partite a punteggi alti o partite a basso ritmo. In entrambi i casi le palle perse assumono un ruolo più centrale, dato che andrebbero a diminuire il VOP. Ecco perché le palle perse del giocatore in analisi si moltiplicano per questo coefficiente, per dare un peso maggiore a questo contributo quando è maggiormente incisivo.

Il sesto termine si ricollega in parte al primo: stiamo nuovamente  considerando i tiri dal campo presi dal giocatore, ma in questo caso ci interessano i tiri dal campo sbagliati.

\boldsymbol{gPER_{6}=VOP\cdot LgDR\%\cdot (FGA-FGM)}

Il numero di tiri sbagliati viene moltiplicato per il VOP: in questo modo, come per le palle perse, si dà maggior peso all’errore al tiro quando questo contribuisce in maniera più incisiva nell’economia di una partita rispetto al gioco standard di lega. Viene anche moltiplicato per il LgDR% perché si vuole correlare il numero di tiri sbagliati con i rimbalzi difensivi, dato che un tiro sbagliato a cui fa seguito un rimbalzo offensivo è meno dannoso di uno che conclude il possesso di squadra.

Il settimo termine riprende il medesimo discorso ma lo si applica ai tiri liberi sbagliati:

\boldsymbol{gPER_{7}=VOP\cdot 0,44\cdot \left [0,44+(0,56\cdot LgDR\%) \right ]\cdot (FTA-FTM)}

Si torna quindi a sommare termini positivi con l’ottavo:

\boldsymbol{gPER_{8}=VOP\cdot (1-LgDR\%)\cdot DR}

I rimbalzi difensivi assumono peso maggiore quando in lega se ne catturano pochi. Ecco che quindi si moltiplica il valore per (1-LgDR%), ovvero la percentuale di rimbalzi offensivi di lega, e anche per il VOP, che viene sempre tenuto in considerazione per il discorso legato ai punti per possesso.

Discorso medesimo per il nono termine, legato invece ai rimbalzi offensivi:

\boldsymbol{gPER_{9}=VOP\cdot LgDR\%\cdot OR}

Le palle rubate hanno valore uguale e contrario alle palle perse: ecco che quindi il decimo termine ha la stessa formula del quinto, ma in questo caso è considerato ovviamente come positivo.

\boldsymbol{gPER_{10}=VOP\cdot ST}

Anche l’undicesimo termine è positivo, ed è legato alle stoppate.

\boldsymbol{gPER_{11}=VOP\cdot LgDR\%\cdot BLK}

La presenza del LgDR% è legata alla correlazione tra rimbalzi difensivi e stoppate descritto nel post del Defensive Rating Individuale.

Infine l’ultimo termine, nuovamente negativo, contabilizza i falli commessi, tenendo conto dei viaggi in lunetta e dei falli commessi in tutta la lega.

\boldsymbol{gPER_{12}=PF\cdot \left [ \frac{LgFTM}{LgPF}-0,44\cdot \frac{LgFTA}{LgPF}\cdot VOP \right ]}

Calcolati tutti i termini li si va a sommare per poi dividerli per i minuti di gioco, ottenendo così il famigerato PER grezzo.

\boldsymbol{gPER=\frac{1}{MP}\cdot (gPER_{1}+gPER_{2}+gPER_{3}+gPER_{4}-gPER_{5}-gPER_{6}-gPER_{7}+gPER_{8}+gPER_{9}+gPER_{1}+gPER_{11}-gPER_{12})}

Il PER grezzo possiamo vederlo come una Valutazione al minuto, nella quale però si dà un peso diverso ai vari contributi. La divisione per i minuti di gioco è l’operazione che ci permette di tenere conto della presenza in campo di un giocatore.

Si può passare così alla seconda parte del calcolo del PER, ovvero la correzione rispetto al Pace di squadra.

\boldsymbol{cPER=gPER\cdot \frac{LgPace}{TePace}}

Per effettuare questa correzione è sufficiente moltiplicare il gPER per il rapporto dei Pace di lega e di squadra; in questo modo si equiparano i PER grezzi dei giocatori rispetto al ritmo medio di lega, depurandoli così dalle differenze di ritmo delle varie squadre.

Siamo giunti all’ultima parte, cioè la creazione della scala di valutazione univoca.
Per eseguire l’ultimo calcolo abbiamo bisogno di effettuare innanzitutto una media ponderata dei PER corretti di tutti i giocatori della lega rispetto ai minuti di gioco. In parole povere si moltiplicano i cPER di ogni giocatore per il loro minutaggio e si sommano tutti i prodotti ottenuti. Tale somma deve essere poi divisa per i minuti totali di gioco (cioè la somma di tutti i minuti giocati da tutti i giocatori). Si utilizza una media ponderata in quanto si vuole dare maggior importanza alle prestazioni di giocatori che stanno in campo più minuti: non è raro che chi giochi 5/6 minuti possa ottenere dei PER corretti molto elevati, ma utilizzando la media ponderata il loro peso sulla sommatoria sarà esiguo, dato che sarà moltiplicato per un valore di minuti molto basso.

E finalmente ottenuto questo valore, si può creare la scala univoca con la seguente formula (a denominatore trovare la media ponderata appena spiegata).

\boldsymbol{PER=15\cdot \frac{cPER}{\frac{\sum_{i=1}^{n}cPER_{i}\cdot min_{i}}{\sum_{i=1}^{n}min_{i}}}}

Effettuando il rapporto tra cPER del singolo giocatore e quello di lega si ottiene il contributo del giocatore parametrizzato rispetto alle prestazioni di tutti i giocatori: moltiplicando questo rapporto per 15 si setta come valore di riferimento il 15 stesso. Ciò vuol dire che la media di tutti i PER sarà sempre 15 e che tale valore sarà la base per i confronti.

Lettura e usi

Per questo esempio ho deciso di creare una mini-lega, formata da quattro squadre, le quali sono composte da due giocatori. Nella mini-lega si gioca 1 vs 1 in partite da 40 minuti. In questo modo avremo una visione completa e chiara del calcolo, cosa che reputo fondamentale per la comprensione.

Altra premessa, il PER può essere calcolato sia per la singola partita, sia per l’intera stagione: bisogna solo utilizzare i giusti dati. Ecco i tabellini delle quattro squadre e la somma delle statistiche di squadra per ottenere i valori di lega.

Il nostro primo compito è calcolare i tre coefficienti legati alle prestazioni di lega:

Conoscendo questi termini è possibile andare a calcolare il PER grezzo di ogni giocatore:

Bamforth e Fesenko hanno catturato un alto numero rimbalzi difensivi eppure il loro gPER8 rimane attorno all’uno. Discorso inverso per il gPER9 (legato ai rimbalzi offensivi): per Fesenko tale valore è molto alto. Questa variazione è dovuta al Defensive Rebound Percentage di lega: in questo esempio il LgDR% è molto alto e perciò il rimbalzo offensivo è raro e, di conseguenza, anche il suo relativo gPER. Nel caso in cui il LgDR% fosse più basso (solitamente si aggira intorno a 0,70-0,75) ecco che i rimbalzi offensivi perderebbero parte della loro importanza, mentre ne guadagnerebbero quelli difensivi.

Discorso simile si può fare per le stoppate: Fesenko ne ha totalizzate cinque e ottiene un gPER11 elevato: questo perché il LgDR% è molto alto.

Per quanto riguarda invece i termini relativi ai canestri, come vedete tra i giocatori che hanno preso più tiri, seppur ci siano differenze in termini di assist e tiri di squadra, i valori finali di gPER1 sono molto simili.

Fatto ciò, bisogna correggere i valori ottenuti per il Pace di squadra:

Il migliore in gPER era di Orelik, seguito da Randolph e Fesenko: i primi due però hanno giocato ad un ritmo decisamente più alto, rispetto al centro. Tramite la correzione rispetto al ritmo, notiamo che è quindi Fesenko il migliore, perché ha saputo sfruttare al meglio i possessi che ha avuto. Questo aspetto di gioco non è assolutamente contemplato nella Valutazione ed è un grosso limite di tale statistica.

Ci manca l’ultima parte del procedimento: calcolare la media ponderata di cPER per ottenere poi i PER di ogni giocatore:

Fesenko è il migliore con un PER di 42, a seguire Orelik e Randolph.

Ma cosa significa avere un PER di 42? Beh, ovviamente maggiore è il valore, migliore sarà il contributo del giocatore. Ma la vera particolarità di questa statistica è che la formula conclusiva del calcolo crea una scala di valutazione fissa e i numeri assumono sempre lo stesso significato. Per sapere quindi cosa voglia dire avere un PER di 42, basta consultare la seguente classificazione stilata da Hollinger stesso:

Più che MVP: 43 o più
MVP: 33 – 42,9
Forte candidato al premio MVP: 30 – 32,9
Candidato di seconda fascia al premio MVP: 25 – 29,9
Giocatore da All-Star: 22,5 – 24,9
Possibile giocatore da All-Star: 20 – 22,4
Seconda opzione offensiva: 18 – 19,9
Terza opzione offensiva: 16,5 – 17,9
Giocatore nella media: 15 – 16,4
Giocatore dalla panchina: 13 – 14,9
Panchinaro fisso: 11 – 12,9
Sventolatore di asciugamani: 9 – 10,9
Ma come è possibile che sia in squadra?: 0 – 8,9

Consultando l’elenco, si capisce come Fesenko abbia giocato davvero bene, da MVP.

In questo esempio abbiamo utilizzato i tabellini di una singola partita, quindi i PER ottenuti assumono valori molto disparati. Infatti il PER è una statistica che assume senso con il passare del tempo, quando i giocatori hanno accumulato molti minuti e contributi. Per una singola partita lascia il tempo che trova, ma è comunque un valore più attendibile della normale Valutazione. A proposito della valutazione, facciamo un rapido confronto Valutazione – PER:

Osservando le Valutazioni, la classificazione dei giocatori sarebbe uguale a quella del PER grezzo: grazie alle correzioni del ritmo e alla ridistribuzione su scala univoca abbiamo una visione dell’efficienza dei giocatori più corretta. Orelik ha giocato molto bene, ma Fesenko è stato più efficace in relazione ai possessi a disposizione.

Ora la domanda sorge spontanea: un giocatore NBA con PER pari a 20 ha la stessa efficienza di uno di Serie A con lo stesso PER? No.

È vero, la scala di valutazione è univoca e ha sempre lo stesso significato, ma solamente all’interno della lega. Difatti quando andiamo a calcolare la media ponderata di tutti i cPER non sommiamo i valori di tutti i giocatori del mondo, ma solo quelli della lega in analisi. Due giocatori con medesimo valore di PER facenti parte di due leghe differenti, avranno lo stesso impatto ed efficienza nelle rispettive leghe, ma tutto in relazione al livello medio della competizione. Confrontare i PER di diverse leghe non è una mossa saggia, diffidate da questo tipo di analisi.

Prima di concludere, un’ultima considerazione: ripercorrendo i calcoli e l’esempio si può notare come il PER non prenda in considerazione diversi contributi difensivi di un giocatore. La statistica di Hollinger tiene conto infatti degli apporti difensivi tangibili (rubate, rimbalzi difensivi e stoppate), mentre omette completamente tutti quei termini semi-tangibili o intangibili che abbiamo scoperto durante lo studio del Defensive Rating individuale.
Il PER prende quindi in considerazione tutti i contributi di un giocatore, ma possiamo affermare che sia una statistica più incentrata sulla fase offensiva, che difensiva.

Alla prossima, il vostro amichevole Cappe di quartiere.

Lascia un commento