Recentemente il Ministero dell' Economia e delle Finanze ha rilasciato i dati delle denunce dei redditi IRPEF 2012 in formato open data. Il dataset che ho preso in considerazione (qui quello arricchito da me con coeff. di Gini) contiene il reddito totale dichiarato per ogni Comune italiano e considera sia il lavoro dipendente che autonomo. E' necessario precisare che si parla di reddito dichiarato, quindi i risultati delle elaborazioni sono ovviamente viziati dall'evasione fiscale non contemplata ne facilmente stimabile. Per il calcolo del reddito medio pro-capite non ho diviso l'ammontare del reddito per il totale di abitanti del Comune ma per il totale dei dichiaranti.
Il reddito medio pro-capite
Ho elaborato il dataset per capire come è distribuita la ricchezza nazionale sul territorio e per farlo ho generato una mappa choropleth che mostra in gradazioni di rosso i redditi pro-capite annuali inferiori alla media nazionale (che si attesta intorno ai 20.000 Euro annui ) e in gradazioni di verde i redditi superiori alla media.
Il risultato, ottenuto utilizzando QGis e TileMill, è un mosaico che evidenzia chiaramente la disparità tra Nord e Sud e la maggiore ricchezza di Milano e Roma e dei capoluoghi. Esplorando la mappa interattiva con il mouse e usando lo zoom si possono indagare i luoghi più ricchi o più poveri del paese e le isole 'felici' o 'infelici' che si differenziano dai vicni. Al Nord per esempio risalta la relativa 'povertà' di molte aree alpine, della zona a Sud di Piacenza e della pianura ferrarese e rovigotta. A Sud, in mezzo al rosso preponderante si evdenziano zone relativamente più benestanti vicino alle coste oltre che intorno ai capoluoghi. Link per la mappa a schermo intero
Le disuguaglianze di reddito
Oltre alle disuguaglianze territoriali che si notano nella mappa esistono anche disuguaglianze nella distribuzione del reddito all'interno dello stesso Comune. Esistono luoghi in cui la ricchezza totale di pochi è molto più alta della ricchezza totale di una moltitudine di persone. L'Italia nel panorama europeo è fanalino di coda per quanto riguarda la disuguaglianza di reddito. Per misurare la disuguale distribuzione della ricchezza si usa l'indice di Gini , un numero compreso tra 0 e 1 che più e grande e più manifesta una concentrazione di ricchezza nelle mani di pochi. Se l'indice di Gini è 0 allora la ricchezza è distribuita in modo uguale a tutte le persone, se è uguale a 1 allora è il caso limite in cui una persona ha tutto e gli altri non hanno niente. Uno dei mezzi che i governi hanno per calmierare le disuguaglianze, le quali possono tradursi in importanti problemi sociali e di sostenibilità economica, è l'imposizione fiscale progressiva (non ultimo il decreto IRPEF dell'attuale governo Renzi)
Ho calcolato l'indice di Gini per ciascun Comune italiano, ho verificato di avere fatto un lavoro accettabile confrontando con i risultati della Banca d'Italia e ho messo in relazione reddito medio pro-capite e indice di Gini costruendo un grafico di dispersione in cui ogni pallino è un Comune. Il grafico non evidenzia una chiara correlazione tra l'aumento di reddito pro-capite e l'aumento di disuguaglianza ma consente di individuare quali sono in Italia i luoghi con reddito pro-capite più alto (i primi 5 : Basiglio, Campione d'Italia, Cusago, Torre d'Isola, Pino Torninese) e quelli con maggiore disuguaglianza di reddito tra gli abitanti (i primi 5: Dambel, Lenno, Rocca De Giorgi, Menarola, Portofino). A proposito delle disuguaglianza va notato che il risultato di Dambel, Rocca de Giorgi e Menarola non è a mio avviso particolarmente significativo per il reddito medio molto basso del primo (poco più di 8.000 euro pro-capite....) e per il fatto che il secondo e terzo hanno rispettivamente 84 e 47 abitanti (direi che sarebbe il caso di abolire simili inutili micro Comuni...).
Attraverso i filtri del grafico si possono analizzare le situazioni delle singole regioni e province.
Dove vivono i super-ricchi
Il dataset analizzato contiene i redditi divisi per fasce di reddito e l'ultima fascia di reddito riporta i contribuenti che dichiarano più di 120.000 Euro annui. Ho allora calcolato il reddito medio di questi 'ricchi' per capire in quali luoghi vi sono poche persone molto più ricche della media dei loro compaesani. Il risultato è un istogramma che evidenzia ai primi posti le città di Lenno (2 Milioni di Euro pro-capite annuali !) Lajatico (dove vive Andrea Bocelli, buon contribuente) Agordo (quartier generale di Luxottica) Tavullia (paese di Valentino Rossi).
Alcuni link dove potete trovare la mappa:
Complimenti! Dati e visualizzazioni molto interessanti.
RispondiEliminaOsservazione: ho notato che ci sono alcuni comuni che non hanno indicazione del reddito. Guardando il DB sembra un errore nel calcolo della madia finale. Sarebbe interessante vedere tutti i comuni (il mio è proprio uno di quelli che manca!).
La mappa è molto interessante, però permette fare poco zoom e ci sono alcune zone dove è complicato distinguere con il mouse un comune dall'altro.
Grazie mille per le osservazioni! Lo zoom l'ho tenuto un po' lontano per non appesantire troppo la mappa. Capisco la difficoltà a centrare il bersaglio... Mi puoi dire quali comuni ti sei accorta che mancano? Può darsi che qualcuna delle oltre 8000 medie si sia persa tra un passaggio e l'altro..
RispondiEliminaPer esempio nella provincia di Rimini ce ne sono 10 che mancano (tra cui Mondaino).
EliminaNella mappa Mondaino c'è e la media è 15512. Forse ti riferisci all'istogramma 'Luoghi da super-ricchi', tale istogramma mostra solo i Comuni nei quali ci sono contribuenti che dichiarano più di 120.000 Euro, in questo istogramma Mondaino come altri 10 circa Comuni di Rimini sono a 0 perchè non ospitano 'ricchi'
EliminaHai ragione. Grazie per il chiarimento.
EliminaNon avevo capito che "Distribuzione del reddito" e "Luoghi da super-ricchi" non erano collegati.
Franco davvero complimenti!
RispondiEliminaMi piacerebbe distinguere meglio tra regioni nel grafico sulla distribuzione del reddito, sembra che abbia plottato i vari comuni una regione dopo l'altra e molte finiscono "sotto". Sbaglio?
Pensi che si riescano a fare 21 "linee di tendenza" (spline), una per regione con tableau?
Ciao Luigi, si si riescono a fare trendlines però ho paura che rendano il tutto abbastanza incomprensibile. Per il resto puoi usare lo zoom per discriminare meglio i punti, lo zoom è attivabile se ti sposti nella parte in alto a sx dello scatterplot.
EliminaComplimenti davvero!
RispondiEliminaE' possibile che invece di reddito pro-capite qui si stia parlando di redditi pro-dichiarante?
RispondiEliminaMi spiego: il reddito totale è stato diviso per il numero degli abitanti o di quelli che presentano dichiarazione dei redditi?
E' il primo dato che mette le cose nella giusta prospettiva, secondo me.
Alcuni centri del Sud, qui, sembrano avere un reddito pari o superiore a dignitose città del nord, con dati molto più alti di quelli che ricordavo e che ho visto altrove.
MI spiego meglio:
al Nord è più facile che ci sia, ad es., una coppia sposata con figlio in cui entrambi hanno un reddito di, tipo, 23.000 euro l'anno; al Sud è tendenzialmente più comune, invece, una coppia in cui lui prende 27.000, la madre è casalinga e ci sono due figli. Si capisce subito chi se la passa meglio, quanto a reddito, ma per la tabella, il Nord sarebbe giallo e il Sud verde.
O mi sbaglio?
Aggiungo: se per caso fosse così (mi scuso per la perentorietà), il dato non terrebbe conto di chi non dichiara, e quindi della disoccupazione. Non cambierebbe tutto?
EliminaMagari sono superficiale e queste cose sono delle ovvietà di cui si è tenuto conto, ma mi è venuto il dubbio e l'ho espresso. Grazie!
Grazie per l'osservazione Francesco, in effetti il reddito è per contribuente. Non ho azzardato una divisione per numero di abitanti xchè volevo restare sui numeri certi e congruenti del dataset del Ministero. Ho fatto questa scelta confortato anche da altre elaborazioni più qualificate della mia: http://www.centrodocumentazionecomuni.it/comuni-analytics/numeri-e-territori/item/962-il-reddito-imponibile-nei-comuni-italiani-scheda-n9
EliminaPerò, allora, considerando che
Elimina1) la disoccupazione al Sud è molto più alta
2) che il tasso di impiego femminile è molto più basso (con molte donne che, in quanto casalinghe, non cercano lavoro, non compaiono nelle stastistiche della disoccupazione e vanno quindi sommate -e non incluse- al dato della disoccupazione)
3) che la fertilità al Sud è un po' più alta del Nord...
se ne conclude che la situazione è ancora peggio di come risulta dal grafico, e la spaccatura ancora più netta.
Complimenti!
RispondiEliminaMagnifico lavoro, complimenti davvero! Sarebbe interessante incrociare i dati dei redditi con quelli del costo della vita. Mi spiego meglio: se uno vive a Milano ed ha un reddito medio pari a 31.761 € potrebbe per assurdo essere più "povero" di uno che vive in un'altra località con un reddito nettamente inferiore.
RispondiEliminaOttimo lavoro, ma avrebbe più senso elaborare il reddito in PPP, ovvero rapportandolo al costo effettivo della vita. Ad esempio io abito a Concordia (Mo) al confine con il mantovano, assicuro che l'arancione della mia zona non è uguale a quello del mantovano dove i prezzi sono sensibilmente più bassi
RispondiEliminaCiao, molti complimenti per il lavoro.
RispondiEliminaTi faccio un appunto, ma sarò felice di essere smentito se mi sbaglio: mi sembra che manchi l'attribuzione della mappa. Hai preso i confini comunali da OSM ?
http://openstreetmap.it/2014/04/attribuzione-e-arrivata-lora-di-fare-i-nomi-di-chi-sgarra/
Bellissimo lavoro. Posso suggerire una versione più amichevole per i daltonici? Credo che in http://en.wikipedia.org/wiki/Choropleth_map si chiami Bi-polar color progression.
RispondiEliminaSarebbe solo per mettere la ciliegina su una torta fantastica ;)
Complimenti, lavoro interessantissimo e chiarissimo.
RispondiEliminaun lavoro eccezionale. grazie. uno spunto: incorociare i dati con il dato medio di evasione fiscale stimata.
RispondiEliminaOttimo lavoro!! ;)
RispondiEliminaChiedo un chiarimento, poiché un dato sembra essere "strano". Comune di Cervere, indicato nel primo grafico su mappa con reddito medio di circa 20000 euro, ma indicato in seguito tra i "super-ricchi" con reddito medio pro-capite da 120000 euro.
RispondiEliminaDove sta la verità? Mi sfugge il motivo di questa discrasia tra i due dati.
Grazie
nella statistica dei "super-ricchi" sono secondo me considerati solo i redditi > 120k. Solo su questo sottoinsieme si fanno poi i calcoli di media etc.
EliminaMi piacerebbe vedere una mappa dell'Italia con la mediana!
Eccellente lavoro!
RispondiEliminaDomanda: noto che Lajatico nel grafico scatter presenta un reddito medio di circa 27k, nell'istogramma è segnalato >120k. Qualcosa mi sfugge?
scusate ma una domanda importantissima per la mia tesi: dove potrei trovare lo stesso dato del MEF ma riferito agli anni passati? Sul sito purtroppo non c'è traccia..
RispondiEliminagrazie ancora.
Purtroppo i dati che cerchi non sono disponibili. Ti consiglio di provare a chiederli direttamente al ministero
EliminaQuali sono i campi del tracciato record ministeriale (mi sono scaricato i dati) per ottenere il reddito complessivo di un Comune? E per quali contribuenti vanno divisi? (quelli indicati nel campo "Numero contribuenti"?).
EliminaGrazie e complimenti per il lavoro
Il reddito complessivo lo ricavi sommando il reddito complessivo di ciascuna fascia di reddito. Poi dividi per la somma del numero di contribuenti di ciascuna fascia
EliminaSi si tutto bello, analisi dei dati interessante, per carita'.
RispondiEliminaPero' scusate se faccio la parte del poco "romantico" ma vedo cosi' poche macchie verdi e cosi' tante macchine di lusso... A cosa ci serve sta cosa se sappiamo che i dato sono corrotti da una evasione che nemmeno sappiamo stimare?
Se posso permettermi non credo sia correttissima l'analisi sui "super-ricchi". Nei dati molti comuni non hanno il valore, ma non significa che non vi è nessun contribuente con quel reddito. Infatti per questioni di privacy non possono essere comunicati valori con frequenza inferiore a 4. I comuni senza super-ricchi sono quindi quelli con frequenza 0, mentre per gli altri non si conosce il dato.
RispondiEliminaLa tua osservazione è corretta
EliminaCiao! Complimenti per il lavorissimo, peccato non si veda più la mappa però :)
RispondiEliminaPenso fosse un problema temporaneo, ora si vede!
EliminaBellissimo lavoro. Potresti darmi delle "kayword" per capire come sei riuscito afare la mappa? Ho conoscenze buone di GIS, shapefile etc e di gmap. Molte grazie.
Eliminaciao, complimenti per il lavoro. Dove ha preso i dati per calcolare gini se posso chiedere?
RispondiEliminaCiao, ho utilizzato sempre il dataset MEF. Ovviamente è un indice approssimato poiché il dataset contiene dati di sole 7 fasce di reddito, in ogni modo é abbastanza allineato.
EliminaCiao, ho utilizzato sempre il dataset MEF. Ovviamente è un indice approssimato poiché il dataset contiene dati di sole 7 fasce di reddito, in ogni modo é abbastanza allineato.
Elimina