CHI VINCERÀ I MONDIALI?

CE LO DICE IL MODELLO....

« Older   Newer »
 
  Share  
.
  1. fabio16
        +1   -1
     
    .

    User deleted


    Questo è un giochino fatto in dipartimento da due miei colleghi, è uscito un articoletto su LaVoce.it

    sono due ragazzi molto in gamba, va preso per quello che è.

    Questi due ragazzi, giovani ricercatori, hanno tirato giù un modello econometrico (roba di statistica) per fare una previsione sui Mondiali di Calcio.

    Non è la bibbia ne nostradamus, è un gioco.


    P.s Collaborano con uno dei migliori Professori Europei.

    Fausto Panuzzi.

    CITAZIONE
    CHI VINCERÀ I MONDIALI? CE LO DICE IL MODELLO
    di Fausto Panunzi 15.06.2010
    Chi vincerà i Mondiali? Sono in molti a chiederselo in questi giorni e a fare previsioni. Comprese Jp Morgan, Ubs e Goldman Sachs. Qui proponiamo un modello econometrico che utilizza dati tecnici e dati socio-economici per indicare quale nazionale ha più probabilità di arrivare alla vittoria finale. Le più accreditate sono la Spagna e l'Inghilterra, possibile outsider l'Olanda. Una previsione confermata anche utilizzando una diversa tecnica, l'analisi fattoriale. Per l'Italia invece le chance di vittoria sono davvero esigue.

    Italia - Paraguay. Campionato del mondo FIFA 2010.


    L’ultima squadra delle trentadue qualificate per il Sud Africa scenderà in campo solo mercoledì 16 giugno, ma è già tempo di chiedersi: chi vincerà i Mondiali? L’articolo di Luciano Canova e Andrea De Capitani, che pubblichiamo oggi, propone una previsione che mette insieme dati tecnici, relativi alla performance delle squadre nelle passate edizioni dei mondiali, e dati socio-demografici, quali reddito pro-capite del paese e tasso di alfabetizzazione. Vi lasciamo alla lettura dell’articolo per sapere quale nazionale si aggiudicherà il mondiale secondo questa previsione. Ma ve ne sono anche molte altre. Alcune le trovate in questo sito.

    PREVISIONI MONDIALI

    JP Morgan fa una previsione basata su dati tecnici (ranking Fifa, risultati nelle qualificazioni e nelle edizioni precedenti dei Mondiali) e di mercato (le quote del bookmakers). Un’analisi che replica quella che JP Morgan usa per valutare le azioni delle società, che utilizza sia variabili legate ai “fondamentali” di mercato che all’investor sentiment. JP Morgan prevede che la Coppa andrà a Londra, con la squadra di Fabio Capello che batterà in finale la Spagna. Secondo questo modello, l’Italia tornerebbe a casa nei quarti, sconfitta dagli spagnoli. Chissà se è cambiato l’investor sentiment dopo la papera del portiere Robert Green. Quello di Capello sicuramente sì.
    Invece Ubs usa i criteri ideati dal fisico Arpad Elo per classificare i giocatori di scacchi, criteri che tengono conto dei risultati precedenti, pesati per la forza dell’avversario (vincere contro Brasile e Spagna ha maggior valore che vincere contro Malta). Il Brasile risulta la squadra favorita, con l’Italia che segue la Germania al terzo posto.
    Goldman Sachsusa un modello con criteri simili a quelli di JP Morgan, ma prevede il Brasile probabile vincitore, con la Spagna subito dopo. L’Italia è al settimo posto con una probabilità di vittoria che è la metà di quella del Brasile.
    I norvegesi del Norwegian Computing Center hanno simulato al computer le partite e hanno trovato la Spagna favorita, davanti ad Argentina e Brasile.
    Insomma, le favorite sono sempre le solite, qualunque modello si usi. Ma il bello del calcio è che le previsioni possono essere smentite facilmente. Nell’atletica, se c’è Usain Bolt, si sa che vincerà lui i 100 metri. Nel calcio, specie nelle partite a eliminazione diretta, basta un errore arbitrale, un rigore che va sul palo o una papera del portiere per cambiare tutto. Il grande Nereo Rocco, a chi gli diceva prima delle partite “Vinca il più forte!”, rispondeva “Speriamo di no”. Ecco, noi speriamo di no, vista l’Italia pre-Mondiale.

    Ed Ecco il Modello:


    CITAZIONE
    Chi vince il Mondiale di calcio del 2010? È una domanda alla quale tutti vogliono dare una risposta. Alcuni prospettano la vittoria dell’una o dell’altra squadra in base a coincidenze astrali degli anni di svolgimento della competizione; altri propongono studi particolari più o meno approfonditi su variabili di ogni genere. Noi partiamo da una serie di dati statistici e tentiamo di stimare, attraverso un modello econometrico e un’analisi fattoriale, la probabilità di vittoria delle diverse nazionali.

    IL MODELLO ECONOMETRICO

    Lo studio econometrico si avvale di un dataset che raccoglie numerose informazioni sulle nazionali di calcio che, almeno una volta nella loro storia, hanno vinto un Mondiale. Si tratta di Italia, Francia, Inghilterra, Germania, Brasile, Uruguay e Argentina.
    Per ragioni di disponibilità di dati, lo studio prende in considerazione le edizioni dei Mondiali a partire dal 1950 e comprende 105 osservazioni. (1)
    Tra le variabili esplicative utilizzate, per ciascuna nazionale in ciascuna delle edizioni cui hanno preso parte, ci sono:
    - differenza reti totale;
    - media punti a partita omogeneizzando i punteggi di tutte le edizioni come segue: vittoria 3 punti, pareggio 1 punto, sconfitta 0 punti e sconfitta ai rigori 1 punto;
    - numero di goal del capocannoniere della nazionale;
    - spettatori per partita, data dalla somma totale dei spettatori presenti alle partite di una nazionale diviso il numero di partite giocate dalla stessa;
    - ammonizioni ed espulsioni, valutandole, rispettivamente, con peso 0.5 e 1;
    - quotazioni dei bookmakers sulla possibilità di vittoria della squadra; (2)
    - età media dei convocati;
    - una variabile che mostra se la nazionale è arrivata tra le prime quattro;
    - numero medio di calciatori della nazionale militanti in campionati esteri rispetto al totale dei convocati;
    - numero di giocatori convocati militanti in squadre che, nell’anno del mondiale, hanno vinto la Coppa dei campioni o la Copa Libertadores;
    - una variabile indicante se la nazionale avesse ospitato il Mondiale in quell’edizione.

    Vi sono inoltre delle variabili di controllo socio-demografiche riferite alla nazione nell’anno del mondiale:
    - il livello di reddito pro-capite;
    - il tasso di alfabetizzazione primario;
    - la densità della popolazione.

    L’obiettivo è quello di individuare quali variabili esplicative hanno avuto il maggior impatto sulla probabilità di vittoria del Mondiale di una nazionale. Per ottenere questi risultati è stato realizzato un modello panel probit considerando come variabile dipendente la probabilità di vittoria del Mondiale e come variabili esplicative quelle precedentemente elencate. I risultati dell’analisi mostrano, con vari test di robustezza, che le variabili di maggiore e significativo impatto sulla probabilità di vittoria in un Mondiale sono i punti a partita (o, in sostituzione ad essa, la differenza reti, con la quale è molto correlata), la presenza di un goleador di razza in squadra e le previsioni dei principali bookmakers.
    Si è osservato come, pur essendo ottime variabili di controllo, le esplicative riferite alle condizioni socio-demografiche non siano significative: il problema risiede, a nostro giudizio, nella differente dimensione economica rispetto alla variabile di interesse. I dati relativi alle squadre sono di carattere micro-economico, mentre il reddito pro-capite, il tasso di istruzione medio e la densità di popolazione fanno riferimento a un livello comunque aggregato.
    Si può, andando avanti, evidenziare la presenza di correlazione positiva e significativa tra la variabile riferita all’organizzazione del mondiale con i punti a partita (o la differenza reti) e con la presenza di un goleador di razza. (3) Questo esito ci permette di identificare un effetto della variabile riferita all’organizzazione del Mondiale sui risultati dello stesso, anche se questa non influenza significativamente la probabilità di vittoria.
    Una possibile estensione sarebbe quella di prendere in considerazione tutti i dati relativi alle nazionali di calcio che, almeno una volta nella loro storia, si sono classificate tra le prime quattro. In quel caso, oltre ad ampliare la dimensione del campione, sarebbe senz’altro possibile catturare l’effetto netto del paese organizzatore. (4)
    Lo studio considera i pesi di ciascuna variabile significativa, ottenuti dai coefficienti del modello stimato, che arrivano dalla storia delle edizioni passate, come coefficienti da applicare ai dati relativi alle qualificazioni mondiali delle squadre presenti in Sudafrica. In particolare, per quanto riguarda il goleador, si è scelto di utilizzare la media-gol nel campionato nazionale giocato degli attaccanti convocati. L’applicazione di questo modello predittivo indica come le due nazionali più accreditate per la vittoria finale siano la Spagna e l’Inghilterra, segnalando come possibile outsider l’Olanda. Nel caso in cui si tenesse conto della classifica della Scarpa d’oro per il miglior goleador della nazionale, ovviamente questa variabile assumerebbe un’importanza maggiore in particolare per l’Argentina, la quale mostra un potenziale offensivo straordinario, che rischia però di essere compromesso con il controllo di altre variabili.

    L'ANALISI FATTORIALE

    La seconda tecnica utilizzata fa capo alla statistica multivariata. Attraverso un’analisi fattoriale, si procede all’aggregazione di dati multi-dimensionali per la costruzione di un indicatore sintetico. L’idea è che un insieme di variabili facenti riferimento alle performance calcistiche condividano un fattore latente, nel nostro caso la forza e le potenzialità di una squadra.
    L’analisi fattoriale consente di calcolare i pesi di ciascuna delle variabili aggregate nel contribuire a tale fattore latente.
    Le informazioni, in questo caso, sono quelle raccolte per le nazionali impegnate in Sudafrica nelle partite che hanno giocato durante le qualificazione al Mondiale 2010. (5)
    Le variabili prese in considerazione sono:
    - differenza reti;
    - punti media a partita;
    - media goal degli attaccanti convocati nelle nazionali nei rispettivi campionati;
    - età media dei convocati;
    - ranking Fifa;
    - quotazioni dei bookmakers; (6)
    - difficoltà del percorso nel mondiale. (7)

    In questo caso, l’indicatore che emerge dall’analisi è un numero a valori crescenti, dalla squadra meno forte a quella più forte. (8)
    Il primo fattore latente contribuisce a spiegare lo 0.6696 della variabilità complessiva, che è un risultato molto soddisfacente. (9)
    Nella tabella seguente sono riportate le variabili con i relativi pesi.

    Tabella 1: Pesi risultanti dall’analisi fattoriale

    Variabili Peso
    differenza reti 0.84
    punti a partita 0.89
    percorso al mondiale -0.88
    bookies 0.82
    ranking Fifa -0.7
    età media giocatori 0.04
    potenziale offensivo -0.15

    Ciascun peso va interpretato come il contributo relativo della variabile alla forza di una squadra: tutti i valori sono ragionevoli. Stupisce il contributo negativo del potenziale offensivo. Una possibile spiegazione sta nel fatto che un attacco senza potenziali titolari, come quello dell’Argentina ad esempio, rende difficile costruire un 11 stabile.
    Il basso valore, inoltre, contribuisce a spiegare il perché, nonostante la forza dei singoli giocatori, l’Argentina finisca con l’essere penalizzata in un giudizio di insieme.
    La nostra predizione, in linea con il modello econometrico descritto, prevede una finale Spagna-Inghilterra (resa possibile, per altro, dalla struttura del tabellone), e una possibile sorpresa Olanda ai danni del Brasile, indicato da molti come la principale candidata alla vittoria finale. (10)
    Concludiamo con le previsioni che probabilmente tutti aspettano con maggiore curiosità: nell’un caso e nell’altro i risultati offrono poche chance agli azzurri. La nazionale italiana ha sì una buona probabilità di passare il turno, ma con tutte le tecniche utilizzate non sembra avere molte opportunità di superare i quarti di finale.


    (1) Il risultato delle 15 edizioni dei Mondiali dal 1950 al 2006 moltiplicato per le 7 nazionali.
    (2) Non disponendo delle quotazioni storiche, per alcune edizioni, abbiamo fatto ricorso a un focus group interrogando alcuni giornalisti sportivi sulle loro probabilità.
    (3) Spearman rank correlation.
    (4) Anche perché si inserirebbero tra le osservazioni i casi di Cile, Svezia e Corea del Sud che, senz’altro, hanno avuto un vantaggio dall’ospitare la competizione.
    (5) Per il Sudafrica, le partite della Confederations Cup.
    (6) Quelle ufficiali per il 2010 dei principali bookmakers inglesi.
    (7) Valutata ancora una volta grazie al parere di esperti giornalisti sportivi.
    (8) Il numero è espresso in unità di standard deviation.
    (9) Lo studio di Ubs, per esempio.
    (10) Anche la distanza tra i valori del primo e del secondo autovalore è superiore all’unità, il che ci consente di utilizzare soltanto il primo fattore come componente per la costruzione del punteggio.

     
    Top
    .
  2.     +1   -1
     
    .

    LIVELLO TECNICO: INLER
    F_STATS

    Group
    UTENTE BANNATO
    Posts
    10,298
    Reputation
    +6,464
    Location
    Gorgonzola

    Status
    Offline
    bisognerebbe vedere quale vincitore avrebbe pronosticato nel 2006 questo modello
     
    Top
    .
  3. _el Puma_
        +1   -1
     
    .

    User deleted


    :o:
     
    Top
    .
  4.     +1   -1
     
    .
    Avatar

    LIVELLO TECNICO: MARADONA

    Group
    TDN Legendary
    Posts
    34,029
    Reputation
    +23,590
    Location
    Dove si è fermato Cristo

    Status
    Offline
    Se il calcio fosse una scienza esatta non varrebbe più la pena di seguirlo.
     
    Top
    .
  5. fabio16
        +1   -1
     
    .

    User deleted


    CITAZIONE (goonda60 @ 16/6/2010, 12:05)
    Se il calcio fosse una scienza esatta non varrebbe più la pena di seguirlo.

    questo è ovvio: ;)

    CITAZIONE
    Insomma, le favorite sono sempre le solite, qualunque modello si usi. Ma il bello del calcio è che le previsioni possono essere smentite facilmente. Nell’atletica, se c’è Usain Bolt, si sa che vincerà lui i 100 metri. Nel calcio, specie nelle partite a eliminazione diretta, basta un errore arbitrale, un rigore che va sul palo o una papera del portiere per cambiare tutto. Il grande Nereo Rocco, a chi gli diceva prima delle partite “Vinca il più forte!”, rispondeva “Speriamo di no”. Ecco, noi speriamo di no, vista l’Italia pre-Mondiale.



    CITAZIONE (geggi69 @ 16/6/2010, 11:05)
    bisognerebbe vedere quale vincitore avrebbe pronosticato nel 2006 questo modello

    lo stavano controllando oggi in pausa pranzo (è pur sempre un giochino), pare che l'italia avrebbe dovuto arrendersi in finale contro il Brasile...
     
    Top
    .
4 replies since 16/6/2010, 07:23   124 views
  Share  
.