L'informazione raccontata a mia nipote
  • L'informazione raccontata a mia nipote
  • The information told to my niece
  • Presentazione
  • Informazione
  • Osservazione
  • Variabilità
  • Variabilità Situazionata
  • Applicazione
  • Divagazione
  • Confronto
  • I conti di Bruxelles
  • Un aggiustamento preferibile
  • Rete di Dipendenza
  • Posizione e Coerenza
  • Conclusioni
  • Il Paradosso della Scienza dei Dati
  • Il Paradosso della Variabilità
  • A caccia dell'Informazione
  • The Hunt for Information
  • Dispersione
  • Dispersion
  • Una Varianza Robusta
  • A Robust Variance
  • Puntata n.3 del 2024
  • Puntata n.4 del 2024
Powered by GitBook

Copiright © 2024 Gabriele Stoppa | blog.gabriele.pro | Tutti i diritti riservati.

On this page

Was this helpful?

Export as PDF

Puntata n.3 del 2024

Una Deviazione Armonica Assoluta e una Retta Armonica Interpolante

Oggi propongo due novità importanti per me. Se qualche lettore si aspetta sofisticatezze sappia che ha sbagliato puntata.

Questo Blog ha dimostrato principalmente il risultato seguente:

In un insieme di k variabili quantitative, {Xi;1≤i≤k}\{X_i; 1 \le i \le k\}{Xi​;1≤i≤k} , queste sono comparabili, nel senso che ammettono sia una misura di locazione/posizione relativa che una di dispersione pure relativa, se e solo se, alla luce della situazione oggetto di studio, sono univocamente uni-direzionate, cioè leggibili come graduatorie, diciamo in chiave migliorativa. Solo così il crescere di ogni grandezza non risulta ambiguo.

Si consideri che a tutt’oggi si pretende di classificare un insieme di variabili secondo la loro dispersione relativa (C.V.) quando, lo sanno tutti, dovrebbe avere la precedenza la loro locazione relativa, che però, a mia memoria, non risulta disponibile. Serve a questo scopo la trasformata dal non preferibile al preferibile (PnP; da 0 a 100) che assegna alle {Xi}\{X_i\}{Xi​} la notazione {tXi}\{tX_i\}{tXi​}.

Nell’esempio EU27 le cinque grandezze sono da leggere rispettivamente come:

  • Miglior Produzione (tPIL)

  • Miglior Deficit, (t|DEF|)

  • Miglior Indebitamento, (tDEB)

  • Miglior Inflazione, (tINF)

  • Miglior Occupazione, (tOCC).

La dispersione standard semi-armonica, σs\sigma_sσs​ , media la dispersione standard σ=E(x2)\sigma = \sqrt{E(x^2)}σ=E(x2)​, e la contro - dispersione standard , σc=Eh(x2)\sigma_c = \sqrt{E_h(x^2)}σc​=Eh​(x2)​, (sta per media armonica). La contro-varianza, σc2\sigma_c^2σc2​ , che si può definire come media armonica dei quadrati degli scarti, va dichiarata altrettanto artificiosa (per non dire sbagliata), quanto la varianza, σ2\sigma^2σ2, ma nella direzione opposta, risultando sottodimensionata la prima e sovradimensionata la seconda.

A breve verrà illustrato il tutto, poi seguiranno le proposte di oggi:

Una deviazione armonica assoluta, δh\delta_h δh​ , e una retta armonica interpolante, bh(y∣x)b_{h(y|x)}bh(y∣x)​.

Osservazione di Pierino:

  • Se la varianza σ2\sigma^2σ2 è così artificiosa perché usare la dispersione standard semi-armonica, σs\sigma_sσs​ , quando si dispone già di una valida deviazione media assoluta, δ\deltaδ ?

  • Dipende, signor Pierino, δ\deltaδ tratta gli scarti alla pari, ma in certi casi la situazione consiglia di contenere quelli in valore assoluto più elevati a vantaggio degli altri.

Notare che, se δ(x)\delta(x)δ(x) è, per definizione, la deviazione media assoluta degli scarti di xxx dalla media E(x)E(x)E(x), si può scrivere δ(x)=δ(x)=E(∣x∣),perx≠0.\delta(x) = \delta(x) = E(|x|), per x \ne 0. δ(x)=δ(x)=E(∣x∣),perx=0. Ora, se è definita la media degli scarti assoluti E(∣x∣)E(|x|)E(∣x∣) , allora è definibile anche la deviazione armonica assoluta di tali scarti, Eh(∣x∣)E_h(|x|)Eh​(∣x∣) del tutto trascurata nella letteratura esistente.

Perciò δh(x)=Eh(∣x∣)=E−1(1∣x∣)\delta_h(x) = E_h(|x|) = E^{-1}\Big(\frac 1{|x|}\Big)δh​(x)=Eh​(∣x∣)=E−1(∣x∣1​) serve essenzialmente come misura di deviazione assoluta da affiancare a δ(x)\delta(x)δ(x) : indispensabile quando non si vuole privilegiare gli scarti elevati in valore assoluto e irrinunciabile quando si tratta di rapporti.

È opportuno indicare la media degli scarti positivi con E(x+)E(x^+)E(x+) e la media di scarti negativi, dovendo ripristinare il segno che le spetta, con (−1)E(−x−)=E−(−x−)=E−(∣x−∣)(-1)E(-x^-) = E^-(-x^-) = E^-(|x^-|)(−1)E(−x−)=E−(−x−)=E−(∣x−∣); analogamente per le medie armoniche Eh(x+)E_h(x^+)Eh​(x+) e En−(x−)E_n^-(x^-)En−​(x−).

Nella tavola che segue è possibile apprezzare il confronto tra i vari riassunti riferiti all’esempio EU-27 (i simboli Er,σr,δrE_r , \sigma_r , \delta_rEr​,σr​,δr​ indicano misure relative):

tX

tPIL

26,6

19,1

13,6

4,3

11,7

6,5

t|DEF|

62,0

29,9

25,1

5,7

17,8

10,3

tDEB

60,2

26,2

21,8

3,7

14,9

6,8

tINF

68,4

27,1

21,7

5,2

16,1

12,2

tOCC

51,4

26,1

22,1

4,7

15,4

9,4

In particolare, il PIL si assesta al 26,6% del tragitto che va dal paese fanalino di coda a quello invidiabile più dotato. Buona la locazione relativa dei 5 parametri che si piazza al 53,7%, con una dispersione, secondo σr\sigma_rσr​, di 25,7 punti percentuali. La locazione relativa migliore, (ErE_rEr​ = 68,4%), spetta all’Inflazione che riceve anche una tra le dispersioni relative peggiori, (σr\sigma_rσr​ = 27,1), assieme al Deficit, (29,9); ciò è confermato sia dalla dispersione standard semi-armonica, (σs\sigma_s σs​ = 16,1), che dalla deviazione armonica assoluta, (δh\delta_hδh​ = 12,2). Il Pil assume la locazione relativa di gran lunga peggiore (ErE_rEr​ = 26,6) pur con una dispersione relativa migliore, (σr\sigma_rσr​ = 19,1), quest’ultima confermata sia dalla dispersione standard semi-armonica (σs\sigma_sσs​ = 11,7), che dalla deviazione armonica assoluta (δh\delta_hδh​ = 6,5).

Secondo Er,σr,σs,δE_r , \sigma_r , \sigma_s, \deltaEr​,σr​,σs​,δ l’Europa dovrebbe mettere mano alla locazione relativa del Pil e alle disparità più marcate, iniziando dal Deficit, quando invece, secondo la deviazione armonica assoluta, δh\delta_hδh​, dovrebbe privilegiare l’Inflazione

Ora, al fine di presentare la retta armonica interpolante, si valuta in dettaglio l’eventuale effetto di xi=x_i =xi​= zINF su yiy_iyi​=zPIL. Operando sugli scarti (la sigla indica che si tratta di punti zeta) la retta interpolante armonica verrà individuata da un solo parametro: il coefficiente di regressione, bh(y∣x)b_{h(y|x)}bh(y∣x)​ .

Si consideri che ogni paese viene rappresentato da un punto del piano cartesiano tramite le coordinate (xi,yi;1≤i≤27)(x_i, y_i; 1 \leq i \leq 27)(xi​,yi​;1≤i≤27). Ciascun punto suggerisce una retta interpolante mediante il rapporto yixi;xi≠0\frac {y_i} {x_i} ; x_i \ne 0xi​yi​​;xi​=0.

È possibile riassumere opportunamente tali rapporti osservati che individuano un fascio di rette del piano centrato sull’origine. Basterà una sintesi delle 27 quantità per ricavare una retta interpolante da preferire a quella dei minimi quadrati. Quale sintesi calcolare? Vediamo di interpretare tale suggerimento alla luce della situazione europea.

Ora, ogni paese può essere rappresentato dalla quantità Qi=yixiQ_i = \frac {y_i} {x_i}Qi​=xi​yi​​ dato che yiy_iyi​ rappresenta la somma disponibile (il pil pro-capite del paese i; si pensi a uno stipendio medio), mentre xix_ixi​ può essere inteso come il prezzo, cioè la penalità che quel paese paga sul mercato in termini di inflazione. Allora i rapporti {Q1=y1x1;Q2=y2x2;...;QN=yNxN}\{Q_1 = \frac {y_1} {x_1} ; Q_2 = \frac {y_2} {x_2}; ... ; Q_N = \frac {y_N} {x_N}\}{Q1​=x1​y1​​;Q2​=x2​y2​​;...;QN​=xN​yN​​} rappresentano proprio le quantità QiQ_iQi​ di un dato bene acquistabili nel paese i, con la somma yiy_iyi​ , al prezzo xix_ixi​ .

Si può pensare al numero di mesi di affitto necessari per un alloggio standard. Per coprire i costi dell’affitto ogni mensilità necessita di quote del Pil pari a {1Q1;1Q2;...;1QN}\{ \frac 1 Q_1 ; \frac 1 Q_2 ; ... ; \frac 1 Q_N\}{Q1​1​;Q1​2​;...;Q1​N​} . Per intenderci: se, ad esempio, con uno stipendio si riesce a saldare 4 mensilità significa che 14\frac 1 441​ dello stipendio viene speso nell’affitto. Dunque il costo europeo mensile, al netto dell’inflazione, risulta pari a {x1y1+x2y2+...+xNyN}\{\frac {x_1} {y_1} + \frac {x_2} {y_2} + ... + \frac {x_N} {y_N}\}{y1​x1​​+y2​x2​​+...+yN​xN​​}. Se gli N paesi pagassero la stessa cifra w affinché il costo europeo rimanga invariato, il costo mensile di ciascun paese dovrà essere 1w\frac 1 ww1​e quello complessivo. Perciò si ha:

Nw=x1y1+x2y2+...+xNyN\frac N w = \frac {x_1} {y_1} + \frac {x_2} {y_2} + ... + \frac {x_N} {y_N}wN​=y1​x1​​+y2​x2​​+...+yN​xN​​
wN=1x1y1+x2y2+...+xNyN\frac w N = \frac 1 {\frac {x_1} {y_1} + \frac {x_2} {y_2} + ... + \frac {x_N} {y_N}}Nw​=y1​x1​​+y2​x2​​+...+yN​xN​​1​
w=Nx1y1+x2y2+...+xNyNw = \frac N {\frac {x_1} {y_1} + \frac {x_2} {y_2} + ... + \frac {x_N} {y_N}}w=y1​x1​​+y2​x2​​+...+yN​xN​​N​

Date rette osservate la sintesi preferibile del fascio è quella che rispetta la situazione complessiva cioè: la media armonica delle quantità acquistabili (Chisini, 1929). Nel caso presente, fatto N1N_1N1​ di rapporti positivi ed N2N_2N2​ negativi (dato che la media armonica è definita solo per quantità positive) si può calcolare la somma armonica delle quantità positive Q+Q^+Q+, e quella delle quantità negative Q−Q^-Q− si può dimostrare che il coefficiente della retta armonica interpolante:

bh(y∣x)=1N(Q+N1−Q−N2);N=N1+N2b_{h(y|x)} = \frac 1 N (Q^+N_1 -Q^-N_2) ; N= N_1+N_2bh(y∣x)​=N1​(Q+N1​−Q−N2​);N=N1​+N2​

Perciò, mentre la soluzione dei minimi quadrati dà la retta, by∣x=−0,12(Q=0,643;R2=21%)b_{y|x} = -0,12 (Q = 0,643; R^2 =21\%)by∣x​=−0,12(Q=0,643;R2=21%) la retta armonica interpolante vale bh(y∣x)=−0,59(R2=7,2%)b_{h(y|x)} = -0,59 (R^2 = 7,2\%)bh(y∣x)​=−0,59(R2=7,2%) (calcoli eseguiti con Statgraphics, 2024).

In sostanza la relazione risulta trascurabile rispetto a quella indicata dai minimi quadrati. Il che significa che ogni settore richiede un intervento specifico senza contare su eventuali effetti collaterali o complementari. La retta armonica interpolante si presenta come qualcosa di più di una semplice alternativa alla retta dei minimi quadrati dato che questa minimizzando la somma dei divari verticali tra valori osservati e previsti esagera gli scarti in valore assoluto più elevati.

PreviousA Robust VarianceNextPuntata n.4 del 2024

Last updated 5 months ago

Was this helpful?

(tX)

(tX)

(tX)

ErE_rEr​
σr\sigma_rσr​
δr\delta_rδr​
σc\sigma_cσc​
σs\sigma_sσs​
δh\delta_hδh​