Circa le statistiche di BGG: un’analisi professionale

Spesso citiamo BoardGameGeek, una community internazionale, dove la lingua prevalente è l’inglese. Oggi vi vorremmo offrire un’analisi su le statistiche di BGG.

Tempo di lettura 6 minuti

Come accaduto altre volte non è totalmente farina del nostro sacco.
Ci siamo alzati l’altra mattina è su un profilo Facebook di Spartaco Albertarelli, noto game designer abbiamo trovato un link.
Lo stesso è poi stato ripostato da altri appassionati di giochi da tavolo.
Parliamo del nuovo blog, stando anche al numero di post, Board Game Data e dell’articolo di Philip Olenyk.
Il nostro contributo non è una mera traduzione del lavoro di Olenyk, che speriamo non si offenda se lo chiamiamo confidenzialmente Philip nel resto dell’articolo.
Speriamo infatti di passarvi anche il nostro punto di vista.
Alle conclusioni tireremo le somme.

Cosa è BoardGameGeek

BoardGameGeek, abbreviato in BGG, è un sito, o meglio una community, che spesso citiamo nei nostri articoli.
Vanta più di 2 milioni di iscritti, ovviamente con partecipazione diversa, e qualsivoglia tipo di gioco è censito.
Alla fine, al di là dei forum e dei sistemi di messaggi, possiamo considerarlo come il più grande database di giochi da tavolo che conosciamo.
E’ molto probabile che un gioco che vi passi per la testa sia su questo portale, con tutta una serie di recensioni e domande degli utenti.
Interessanti spesso anche i files che i fan del gioco postano e sono scaricabili dagli iscritti.
In puro stile anglosassone inoltre, ogni gioco è catalogato per meccaniche e famiglia, ad esempio.
In particolare sono affidati dagli utenti anche due punteggi Peso (Weight) e un Voto Medio (Average Rating).
Su questi due fattori verte questo articolo e il lavoro di Philip sulle statistiche di BGG.

Peso (Weight)

La definizione di peso la riprendiamo da BGG.
In estrema sintesi, con un punteggio da 1 a 5, l’utente è chiamato a indicare quanto è difficile un gioco da capire.
Votando 5 significa che siamo di fronte a qualcosa di complesso, mentre un 1 indica che è intuitivo.
BGG pone alcuni punti di vista per il calcolo di questa componente.
Alcuni, sinceramente, non sono chiarissimi.
Riporta infatti il sito che per alcuni giocatori il Peso dipenda da quanto interviene la fortuna nel gioco.
Altre volte la domanda da porsi è più corretta, come ad esempio quante partite sono necessarie affinché il giocatore si senta a suo agio e possa affermare di avere capito il gioco, sfumature comprese.

Voto Medio (Average Rating)

Qui c’è meno da scervellarsi. Ogni utente può votare il gioco in base alle proprie preferenze.
Si può dare un voto come a scuola da 1 a 10 e scrivere qualche riga di commento.
Il server di BGG farà tutti i calcoli dei dati raccolti e calcolerà una media.
Chi ha pensato questo sito doveva essere un fan delle statistiche.
Di fatti si può scendere fino al dettaglio più estremo, con tanto di deviazione standard.
Ci sono poi tutta una serie di classifiche che incasellano ogni titolo.

Le impietose statistiche di Monopoly (credit: BGG)

Le impietose statistiche di Monopoly (credit: BGG)

Il lavoro di Board Game Data

Un lavoro molto accurato

Board Game Data con Philip Olenyk fa un lavoro certosino, da statistico professionista.
Tanto di cappello insomma.
Se dovessimo ad ogni costo muovere una critica, diremmo che alcuni passi sono ben comprensibili per chi ha una base di matematica.
Cercheremo di scodellare lo studio in parole più semplici, anche se temiamo non sempre corrette.
Chiediamo venia fin d’ora a Philip e a chi conosce meglio questo dettagli.

Peso e Voto Medio

Quello che propone Philip è abbastanza semplice.
Il 10 Novembre 2020 ha scaricato da BGG tutti i giochi che abbiano avuto almeno 30 voti sul Peso e 30 voti che contribuissero a decretarne il Voto Medio.
Insomma, se un gioco ha 2 voti con due 10 è probabile che sia stato il cugino dell’autore. Il dato inquinerebbe solo l’analisi.
Ha preso quindi, virtualmente, un foglio di carta millimetrata e ha messo dei pallini in un grafico cartesiano.
Per la x ha preso il Peso (che va da 1 a 5) e per la y il Voto Medio (che va da 1 a 10).
Non preoccupatevi: il fatto che la scala di punteggi sia differente non cambia nulla.
Ecco che n’è saltato fuori:

https___bucketeer-e05bbc84-baa3-437e-9518-adb32be77984.s3.amazonaws.com_public_images_e92e213b-0d14-4600-a893-de27808f7e0a_908x599

Ogni gioco catalogato da Philip è un puntino che ha come x il Peso e y il Voto Medio (credit: Board Game Data)

Nel grafico trovate la parola mediana.
Niente paura: significa che la metà dei giochi ha, un Peso (Complexity nel grafico) o un Voto Medio (Rating) a seconda dell’asse preso, maggiore di quel valore e l’altra metà minore.

High Frontier è un gioco che prima di sedersi al tavolo tocca aver preso una laurea. Dalla community è osannato. Molto simulativo per carità, ma che la casalinga di Voghera l'abbia apprezzato è improbabile (credit: BGG)

High Frontier è un gioco che prima di sedersi al tavolo tocca aver preso una laurea. Dalla community è osannato. Molto simulativo per carità, ma che la casalinga di Voghera l’abbia apprezzato è improbabile (credit: BGG)

Cosa si propone questo studio

Già senza avere una laurea in matematica, avrete visto come i giochi con un Peso maggiore vengono premiati di più dalla community di BGG.
Philip fa qualcosa di più e calcola la regressione lineare.
Per semplificare, l’autore si chiede se in mezzo a quella nuvola non si possa tracciare una linea e dire che più o meno quella è la relazione che lega il Peso di un gioco al suo Voto Medio.
Almeno stando a quando ne pensano gli utenti di BGG.
Se non siete curiosi circa altri parametri tecnici saltate al prossimo paragrafo.

Un approfondimento

Altrimenti possiamo dirvi che è stato calcolato il coefficiente R quadro. Questo coefficiente ci dice se la linea che abbiamo tracciato centri qualcosa con la nuvola dei dati presi sul sito.
La risposta è 35%.
Se volete farvi ancora del male possiamo dirvi che il p-value è 0. Ciò significa che la linea che abbiamo tirato ci imbrocchi per caso non è probabile.

Philip traccia una linea per mettere in relazione i dati (credit: Board Game Data)

Philip traccia una linea per mettere in relazione i dati (credit: Board Game Data)

Tiriamo le somme

Cosa significano queste statistiche di BGG?
Lo spieghiamo con esempio. Supponiamo che un gioco abbia Peso 3 e Voto Medio 7.
Se trovassimo un gioco di Peso 4 è probabile che il Voto Medio sia 7.57.
Significa cioè che quell’andamento che avevate visto ad occhio, è confermato dalla scienza.

“Correzione” della classifica dei 100 migliori giochi BGG, non mortificando i giochi più “semplici” (cliccate per l’animazione) (credit: dvatvani.github.io/)

La riscossa dei bistrattati

A questo punto Philip prova a correggere i dati, in modo che i giochi più semplici non siano puniti con voti più bassi.
In statistica si parla di bias, ma anche l’autore è scettico a dare una spiegazione netta sui risultati ottenuti, che necessiterebbero di altre ipotesi e dati.
Per farla semplice Philip pensa di creare una” correzione”, se di correzione possiamo parlare, e mette a disposizione uno strumento on-line per rivalutare i giochi nell’ottica sopra descritta.

Codenames se vogliamo è un eccezione: Peso alto e Voto Medio alto (credit: BGG)

Codenames se vogliamo è un eccezione: Peso alto e Voto Medio alto (credit: BGG)

Dove approfondire l’argomento

L’autore dell’articolo ci rimanda a studi simili.
L’articolo Looking at a Board Game Collection Like a Data Scientist” di Maddy Doak e Josh Reiss propone sia alcuni riferimenti per approfondire la questione on-line, sia fa altre considerazioni.
Forse la lettura è dedicata a chi davvero vuole sviscerare la questione.

Diverso discorso per Dinesh Vatvani.
Prenderemo sicuramente spunto dal suo blog, come da quello di Board Game Data e dell’articolo di Philip Olenyk per ulteriori articoli.
I grafici interattivi di Vtavani sono davvero spettacolari!
A questo link abbiamo preso il grafico sovrastante, ma ce ne sono diversi altri, come la classifica ricalcolata evitando di premiare solo giochi di Peso.

Pictionary è un gioco che sta nella

Pictionary è un gioco che sta nella “curva del rancore”: uscito 40 anni fa è semplicissimo e ha un voto basso. Davvero ingiocabile? (credit: BGG)

In conclusione

Siamo felici di avere trovato il link a Board Game Data che poi ci ha aperto la strada ad altri siti sulla stessa lunghezza d’onda.
E’ chiaro che il voto che si dà ad un gioco, e questo lo riporta anche Philip, dipende dal proprio gusto.
Poi, per carità, può essere che un gioco più è di Peso più Bello è.
Quello che invece è più probabile è che ci sia un bias di campionamento.
Prima di fasciarvi la testa, diciamo che in sintesi se chiediamo a un gruppo di persone che la pensa più o meno nello stesso modo (o che si influenzi a vicenda?) otterremo un certo tipo di risultato.
Questo risultato non è per forza una fotografia della realtà.

Cosa abbiamo imparato

Philip ci propone una correzione su alcuni giochi per ridare dignità a giochi semplici.
Qualcosa di simile fa Vtavani nel 2018 sui i primi 100 giochi della classifica di BGG, proponendo anche una rivalutazione.
Anzi, questo autore ci parla anche di “coda del rancore” ovvero di giochi vecchi che si trovano nell’angolo in basso a sinistra del grafico.
Che siano davvero superati o solo vittime di un atteggiamento snob?
L’importante è che abbiamo imparato a valutare con grano salis le statistiche di BGG

I commenti sono chiusi.