L'informazione raccontata a mia nipote
  • L'informazione raccontata a mia nipote
  • The information told to my niece
  • Presentazione
  • Informazione
  • Osservazione
  • Variabilità
  • Variabilità Situazionata
  • Applicazione
  • Divagazione
  • Confronto
  • I conti di Bruxelles
  • Un aggiustamento preferibile
  • Rete di Dipendenza
  • Posizione e Coerenza
  • Conclusioni
  • Il Paradosso della Scienza dei Dati
  • Il Paradosso della Variabilità
  • A caccia dell'Informazione
  • The Hunt for Information
  • Dispersione
  • Dispersion
  • Una Varianza Robusta
  • A Robust Variance
  • Puntata n.3 del 2024
  • Puntata n.4 del 2024
Powered by GitBook

Copiright © 2024 Gabriele Stoppa | blog.gabriele.pro | Tutti i diritti riservati.

On this page

Was this helpful?

Export as PDF

Puntata n.3 del 2024

Una Deviazione Armonica Assoluta e una Retta Armonica Interpolante

PreviousA Robust VarianceNextPuntata n.4 del 2024

Last updated 4 months ago

Was this helpful?

Oggi propongo due novità importanti per me. Se qualche lettore si aspetta sofisticatezze sappia che ha sbagliato puntata.

Questo Blog ha dimostrato principalmente il risultato seguente:

In un insieme di k variabili quantitative, {Xi;1≤i≤k}\{X_i; 1 \le i \le k\}{Xi​;1≤i≤k} , queste sono comparabili, nel senso che ammettono sia una misura di locazione/posizione relativa che una di dispersione pure relativa, se e solo se, alla luce della situazione oggetto di studio, sono univocamente uni-direzionate, cioè leggibili come graduatorie, diciamo in chiave migliorativa. Solo così il crescere di ogni grandezza non risulta ambiguo.

Si consideri che a tutt’oggi si pretende di classificare un insieme di variabili secondo la loro dispersione relativa (C.V.) quando, lo sanno tutti, dovrebbe avere la precedenza la loro locazione relativa, che però, a mia memoria, non risulta disponibile. Serve a questo scopo la trasformata dal non preferibile al preferibile (PnP; da 0 a 100) che assegna alle {Xi}\{X_i\}{Xi​} la notazione {tXi}\{tX_i\}{tXi​}.

Nell’esempio EU27 le cinque grandezze sono da leggere rispettivamente come:

  • Miglior Produzione (tPIL)

  • Miglior Deficit, (t|DEF|)

  • Miglior Indebitamento, (tDEB)

  • Miglior Inflazione, (tINF)

  • Miglior Occupazione, (tOCC).

La dispersione standard semi-armonica, σs\sigma_sσs​ , media la dispersione standard σ=E(x2)\sigma = \sqrt{E(x^2)}σ=E(x2)​, e la contro - dispersione standard , σc=Eh(x2)\sigma_c = \sqrt{E_h(x^2)}σc​=Eh​(x2)​, (E_h\sta per media armonica). La contro-varianza, σc2\sigma_c^2σc2​ , che si può definire come media armonica dei quadrati degli scarti, va dichiarata altrettanto artificiosa (per non dire sbagliata), quanto la varianza, σ2\sigma^2σ2, ma nella direzione opposta, risultando sottodimensionata la prima e sovradimensionata la seconda.

A breve verrà illustrato il tutto, poi seguiranno le proposte di oggi:

Una deviazione armonica assoluta, δh\delta_h δh​ , e una retta armonica interpolante, bh(y∣x)b_{h(y|x)}bh(y∣x)​.

Osservazione di Pierino:

  • Se la varianza σ2\sigma^2σ2 è così artificiosa perché usare la dispersione standard semi-armonica, σs\sigma_sσs​ , quando si dispone già di una valida deviazione media assoluta, δ\deltaδ ?

  • Dipende, signor Pierino, δ\deltaδ tratta gli scarti alla pari, ma in certi casi la situazione consiglia di contenere quelli in valore assoluto più elevati a vantaggio degli altri.

Notare che, se δ(x)\delta(x)δ(x) è, per definizione, la deviazione media assoluta degli scarti di xxx dalla media E(x)E(x)E(x), si può scrivere δ(x)=δ(x)=E(∣x∣),perx≠0.\delta(x) = \delta(x) = E(|x|), per x \ne 0. δ(x)=δ(x)=E(∣x∣),perx=0. Ora, se è definita la media degli scarti assoluti E(∣x∣)E(|x|)E(∣x∣) , allora è definibile anche la deviazione armonica assoluta di tali scarti, Eh(∣x∣)E_h(|x|)Eh​(∣x∣) del tutto trascurata nella letteratura esistente.

tX

tPIL

26,6

19,1

13,6

4,3

11,7

6,5

t|DEF|

62,0

29,9

25,1

5,7

17,8

10,3

tDEB

60,2

26,2

21,8

3,7

14,9

6,8

tINF

68,4

27,1

21,7

5,2

16,1

12,2

tOCC

51,4

26,1

22,1

4,7

15,4

9,4

È possibile riassumere opportunamente tali rapporti osservati che individuano un fascio di rette del piano centrato sull’origine. Basterà una sintesi delle 27 quantità per ricavare una retta interpolante da preferire a quella dei minimi quadrati. Quale sintesi calcolare? Vediamo di interpretare tale suggerimento alla luce della situazione europea.

In sostanza la relazione risulta trascurabile rispetto a quella indicata dai minimi quadrati. Il che significa che ogni settore richiede un intervento specifico senza contare su eventuali effetti collaterali o complementari. La retta armonica interpolante si presenta come qualcosa di più di una semplice alternativa alla retta dei minimi quadrati dato che questa minimizzando la somma dei divari verticali tra valori osservati e previsti esagera gli scarti in valore assoluto più elevati.

Perciò δh(x)=Eh(∣x∣)=E−1(1∣x∣)\delta_h(x) = E_h(|x|) = E^{-1}\Big(\frac 1{|x|}\Big)δh​(x)=Eh​(∣x∣)=E−1(∣x∣1​) serve essenzialmente come misura di deviazione assoluta da affiancare a δ(x)\delta(x)δ(x) : indispensabile quando non si vuole privilegiare gli scarti elevati in valore assoluto e irrinunciabile quando si tratta di rapporti.

È opportuno indicare la media degli scarti positivi con E(x+)E(x^+)E(x+) e la media di scarti negativi, dovendo ripristinare il segno che le spetta, con (−1)E(−x−)=E−(−x−)=E−(∣x−∣)(-1)E(-x^-) = E^-(-x^-) = E^-(|x^-|)(−1)E(−x−)=E−(−x−)=E−(∣x−∣); analogamente per le medie armoniche Eh(x+)E_h(x^+)Eh​(x+) e En−(x−)E_n^-(x^-)En−​(x−).

Nella tavola che segue è possibile apprezzare il confronto tra i vari riassunti riferiti all’esempio EU-27 (i simboli Er,σr,δrE_r , \sigma_r , \delta_rEr​,σr​,δr​ indicano misure relative):

(tX)

(tX)

(tX)

In particolare, il PIL si assesta al 26,6% del tragitto che va dal paese fanalino di coda a quello invidiabile più dotato. Buona la locazione relativa dei 5 parametri che si piazza al 53,7%, con una dispersione, secondo σr\sigma_rσr​, di 25,7 punti percentuali. La locazione relativa migliore, (ErE_rEr​ = 68,4%), spetta all’Inflazione che riceve anche una tra le dispersioni relative peggiori, (σr\sigma_rσr​ = 27,1), assieme al Deficit, (29,9); ciò è confermato sia dalla dispersione standard semi-armonica, (σs\sigma_s σs​ = 16,1), che dalla deviazione armonica assoluta, (δh\delta_hδh​ = 12,2). Il Pil assume la locazione relativa di gran lunga peggiore (ErE_rEr​ = 26,6) pur con una dispersione relativa migliore, (σr\sigma_rσr​ = 19,1), quest’ultima confermata sia dalla dispersione standard semi-armonica (σs\sigma_sσs​ = 11,7), che dalla deviazione armonica assoluta (δh\delta_hδh​ = 6,5).

Secondo Er,σr,σs,δE_r , \sigma_r , \sigma_s, \deltaEr​,σr​,σs​,δ l’Europa dovrebbe mettere mano alla locazione relativa del Pil e alle disparità più marcate, iniziando dal Deficit, quando invece, secondo la deviazione armonica assoluta, δh\delta_hδh​, dovrebbe privilegiare l’Inflazione

Ora, al fine di presentare la retta armonica interpolante, si valuta in dettaglio l’eventuale effetto di xi=x_i =xi​= zINF su yiy_iyi​=zPIL. Operando sugli scarti (la sigla indica che si tratta di punti zeta) la retta interpolante armonica verrà individuata da un solo parametro: il coefficiente di regressione, bh(y∣x)b_{h(y|x)}bh(y∣x)​ .

Si consideri che ogni paese viene rappresentato da un punto del piano cartesiano tramite le coordinate (xi,yi;1≤i≤27)(x_i, y_i; 1 \leq i \leq 27)(xi​,yi​;1≤i≤27). Ciascun punto suggerisce una retta interpolante mediante il rapporto yixi;xi≠0\frac {y_i} {x_i} ; x_i \ne 0xi​yi​​;xi​=0.

Ora, ogni paese può essere rappresentato dalla quantità Qi=yixiQ_i = \frac {y_i} {x_i}Qi​=xi​yi​​ dato che yiy_iyi​ rappresenta la somma disponibile (il pil pro-capite del paese i; si pensi a uno stipendio medio), mentre xix_ixi​ può essere inteso come il prezzo, cioè la penalità che quel paese paga sul mercato in termini di inflazione. Allora i rapporti {Q1=y1x1;Q2=y2x2;...;QN=yNxN}\{Q_1 = \frac {y_1} {x_1} ; Q_2 = \frac {y_2} {x_2}; ... ; Q_N = \frac {y_N} {x_N}\}{Q1​=x1​y1​​;Q2​=x2​y2​​;...;QN​=xN​yN​​} rappresentano proprio le quantità QiQ_iQi​ di un dato bene acquistabili nel paese i, con la somma yiy_iyi​ , al prezzo xix_ixi​ .

Si può pensare al numero di mesi di affitto necessari per un alloggio standard. Per coprire i costi dell’affitto ogni mensilità necessita di quote del Pil pari a {1Q1;1Q2;...;1QN}\{ \frac 1 Q_1 ; \frac 1 Q_2 ; ... ; \frac 1 Q_N\}{Q1​1​;Q1​2​;...;Q1​N​} . Per intenderci: se, ad esempio, con uno stipendio si riesce a saldare 4 mensilità significa che 14\frac 1 441​ dello stipendio viene speso nell’affitto. Dunque il costo europeo mensile, al netto dell’inflazione, risulta pari a {x1y1+x2y2+...+xNyN}\{\frac {x_1} {y_1} + \frac {x_2} {y_2} + ... + \frac {x_N} {y_N}\}{y1​x1​​+y2​x2​​+...+yN​xN​​}. Se gli N paesi pagassero la stessa cifra w affinché il costo europeo rimanga invariato, il costo mensile di ciascun paese dovrà essere 1w\frac 1 ww1​e quello complessivo. Perciò si ha:

Nw=x1y1+x2y2+...+xNyN\frac N w = \frac {x_1} {y_1} + \frac {x_2} {y_2} + ... + \frac {x_N} {y_N}wN​=y1​x1​​+y2​x2​​+...+yN​xN​​
wN=1x1y1+x2y2+...+xNyN\frac w N = \frac 1 {\frac {x_1} {y_1} + \frac {x_2} {y_2} + ... + \frac {x_N} {y_N}}Nw​=y1​x1​​+y2​x2​​+...+yN​xN​​1​
w=Nx1y1+x2y2+...+xNyNw = \frac N {\frac {x_1} {y_1} + \frac {x_2} {y_2} + ... + \frac {x_N} {y_N}}w=y1​x1​​+y2​x2​​+...+yN​xN​​N​

Date rette osservate la sintesi preferibile del fascio è quella che rispetta la situazione complessiva cioè: la media armonica delle quantità acquistabili (Chisini, 1929). Nel caso presente, fatto N1N_1N1​ di rapporti positivi ed N2N_2N2​ negativi (dato che la media armonica è definita solo per quantità positive) si può calcolare la somma armonica delle quantità positive Q+Q^+Q+, e quella delle quantità negative Q−Q^-Q− si può dimostrare che il coefficiente della retta armonica interpolante:

bh(y∣x)=1N(Q+N1−Q−N2);N=N1+N2b_{h(y|x)} = \frac 1 N (Q^+N_1 -Q^-N_2) ; N= N_1+N_2bh(y∣x)​=N1​(Q+N1​−Q−N2​);N=N1​+N2​

Perciò, mentre la soluzione dei minimi quadrati dà la retta, by∣x=−0,12(Q=0,643;R2=21%)b_{y|x} = -0,12 (Q = 0,643; R^2 =21\%)by∣x​=−0,12(Q=0,643;R2=21%) la retta armonica interpolante vale bh(y∣x)=−0,59(R2=7,2%)b_{h(y|x)} = -0,59 (R^2 = 7,2\%)bh(y∣x)​=−0,59(R2=7,2%) (calcoli eseguiti con Statgraphics, 2024).

ErE_rEr​
σr\sigma_rσr​
δr\delta_rδr​
σc\sigma_cσc​
σs\sigma_sσs​
δh\delta_hδh​