Il Paradosso della Variabilità

Paradosso della Variabilità

Buon giorno, bentornati. Spero siate tutti in grande forma. Ora vi aspetta un paradosso che si rifiuta di fornire indicazioni sufficienti. Infatti si vorrebbe che qualche giovane appassionato si cimentasse su queste tematiche. I risultati ammissibili sono alla portata di tutti gli uomini di buona volontà. Perciò sono ridotto a disattendere le promesse fatte a mia nipote: pure lei dovrà metterci del suo. Il fatto è che questo Blog, iniziato per sfida, quasi per gioco, sta diventando talmente serio che rischia di diventare il mio testamento scientifico.

Paradosso della variabilità:

La variabilità di una serie di dati quantitativi si misura adeguatamente attraverso la varianza.

Siamo sicuri? Ora lo vediamo.

Dalle variazioni alla variabilità

In questa sede si contesta il fatto che il crescere di una dimensione possa essere rappresentato adeguatamente tramite la varianza in quanto questa opera su un certo tipo di variazioni: sugli scarti dalla media. Gli scarti dalla media sono soltanto variazioni particolari che individuano una sorta di balletto. La variabilità è un concetto più ampio che dovrebbe intendere di per sé un muovere. La variabilità di una grandezza, oltre alla sua capacità di prendere valori differenti, non dovrebbe necessitare di specificazioni, pretende però di avere a che fare con il suo variare, con il suo evolvere, con il suo crescere. Infatti si è spesso interessati a capire cosa succede a una o più altre serie proprio al crescere della serie di partenza (non si è interessati a capire come balla una serie al ballare di un’altra). La variabilità, almeno quella qui intesa, è invece la capacità di correre lungo un campo di realizzazione, non attorno a un punto sia pure dotato di proprietà particolari. Il variare di una grandezza dovrebbe essere inteso come il suo muovere, il suo evolvere, solitamente il suo crescere, verosimilmente interpretabile rispetto al contesto.

Infatti la varianza è colpevole su due fronti:

1) Misura come balla una serie di dati attorno al suo baricentro, ossia lavora sulle variazioni, quando invece, con tutto il rispetto nei confronti del baricentro, dovrebbe misurare come muove la serie, come corre, come evolve, come cresce: cioè la sua capacità di variare, di evolvere, la sua variabilità effettiva;

2) Inoltre, elevando al quadrato, distorce gli scarti esagerando così l’importanza di quelli elevati a danno degli altri. Si ha un bel dire che poi si va a farne la radice quadrata scegliendo la soluzione positiva (σ) in modo da riportare il tutto all’unità di misura, ma ciò non è in grado di rimediare al danno ormai combinato. Non a caso è stato proposto in alternativa, ma con scarso successo, la media dei valori assoluti degli scarti la quale comunque risolverebbe il secondo fronte, ma non il primo.

Quanto detto dimostra che la varianza non è adeguata a misurare la variabilità di una serie di dati.

Perciò si sconsiglia l’uso della varianza () e dei suoi derivati, deviazione standard (σ) e coefficiente di variazione (C.V.), per non parlare delle innumerevoli metodiche basate su tale misura, per evidenti problemi concettuali coinvolti, a mia conoscenza mai rilevati né messi in discussione nella letteratura metodologica (Si sorvola sui momenti diversi dal primo e dal secondo). Siccome gran parte della metodologia attuale si basa sulla varianza si può immaginare lo stato della scienza dei dati contemporanea, per non parlare della ricerca scientifica.

La Scienza dei Dati deve ancora nascere. La Scienza dei Dati ha bisogno di sostanza e di coscienza. Buon lavoro!

Un confronto

Ecco che già mi pento di aver limitato le spiegazioni: perciò propongo di mettere il tutto a confronto con l’esempio relativo alla situazione economica dei paesi EU27. Ho in mente una misura di variabilità (indicata con il simbolo Δ), che si può chiamare elementare, che non definirò, di facile calcolo per le grandezze elementari (in precedenza chiamate informative), quelle che ammettono interpretazione univoca rispetto alla situazione in analisi, ma, con un aggiustamento opportuno, adattabile a tutte le altre (non elementari). Sta a Voi indovinare la misura di variabilità elementare utilizzata o trovarne una adeguata.

Si osservi la tabella seguente:

Notare che il coefficiente di variazione non permette un confronto completo tra le cinque dimensioni mentre, attraverso la misura di variabilità relativa elementare (Δ) è possibile valutare i pesi delle grandezze coinvolte. Questo permetterebbe di individuare quale area meriti un intervento prioritario essendo ogni dimensione diversamente informativa: lo dicono le serie registrate. La variabilità relativa (C.V.) non permette una risposta dato che una dimensione possiede un valore medio prossimo allo zero (-0,107). La %C.V. si limita a considerare le altre quattro grandezze. La variabilità classica lascia primeggiare l’Inflazione e fa perdere terreno all’Occupazione risultando entrambe ben lontano dal 25% atteso. La variabilità relativa elementare fornisce invece i valori. La variabilità relativa elementare rende più informativi il Deficit e l’Inflazione: ben lontani dal 20% atteso.

Ho incautamente promesso a mia nipote di arrivare a otto paradossi: sarebbe un bel ottovolante. Si capisce che una giostra di questo tipo di certo non vola né, tantomeno, pretende di arrivare da qualche parte.

Last updated

Copiright © 2024 Gabriele Stoppa | blog.gabriele.pro | Tutti i diritti riservati.