Una Varianza Robusta

Una varianza robusta in ambito non-campionario

La rifondazione della Scienza dei Dati dovrà fare i conti con la metrica aggiuntiva qui proposta chiamata varianza robusta. La robustezza, una proprietà degli stimatori campionari nei confronti di ipotesi attenuate, qui riferita alla metrica della quadratura degli scarti, va intesa rispetto agli effetti indesiderati già denunciati in tema di varianza. La varianza soffre del complesso di superiorità, mentre la deviazione assoluta mostra invece un complesso di inferiorità: certo è che si mostra timida e sussiegosa, mentre, in un certo senso, non prende posizione. Con questa idea in mente si propone, per una variabile X osservata su un collettivo di N unità, una famiglia di varianze robuste: , , con scarti , doveè una funzione crescente nel tratto reale negativo e decrescente in quello positivo in modo da produrre sugli scartieffetti opposti rispetto alla varianza. Ciò equivarrebbe a una rivincita degli scarti che occupano le posizioni centrali in modo da snobbare gli scarti laterali, come definiti a breve. Della famiglia preferire la varianza robusta: dove α è un parametro che modula la correzione dei difetti prodotti dalla quadratura sfruttando il rapporto tra l’inverso della deviazione assoluta dei reciproci,e la deviazione assoluta degli scarti,. Vediamo innanzitutto come si comportano due tipi di scarti differenti: standardizzati, , e normalizzati, tX, con la trasformata PnP (dal non-preferibile al preferibile) in percentuale, relativi ai cinque parametri forniti da Bruxelles già trattati in precedenza.

zX

min≤max

%||<1

zPil

1

0,695

V

-1,4≤3,8

74

0,461

II

0,47

zDeficit

1

0,782

III

-1,9≤2,0

67

0,455

III

0,41

zDebito

1

0,816

II

-1,5≤2,3

67

0,446

II

0,31

zInflazione

1

0,752

IV

-1,2≤3,0

70

0,497

I

0,76

zOccupazione

1

0,830

I

-2,0≤1,9

63

0,334

V

0,18

Si possono chiamare centrali gli scarti il cui valore assoluto è minore dell’unità: in media costituiscono il 66%; gli scarti laterali, aventi un valore assoluto maggiore di uno, arrivano al 34%. Gli scarti centrali vengono fortemente ridimensionati dalla quadratura operata dalla varianza mentre quelli laterali vengono esagerati. Tale è l’impatto della varianza come metrica. Perciò si potrà preferire la varianza robusta proposta come alternativa o, se si preferisce, come completamento. Si noti cheα, mediamente (0,43), quasi dimezza la correzione dei difetti suddetti.Necessitano di interventi prioritari i parametri europei con maggior variabilità robusta, Inflazione e Debito, piuttosto che Occupazione e Debito, come indicati dalla deviazione assoluta. Infatti, la deviazione robusta,, non concorda con la deviazione assoluta, δ.L’effetto sovrastima si può riassumere nel modo seguente: la deviazione standard, σ, in media, vale 1,29 volte la deviazione assoluta, δ, e 2,28 volte la deviazione robusta, , mentreδ è, in media, 1,77 volte . Le cose stanno diversamente per gli scarti , ovvero PnP su scala percentuale, su variabili leggibili come graduatorie (scala che va dal non preferibile al preferibile):

minmax

%|x|<|1|

tPil

19,50

13,57

V

-27≤74

0

9,01

IV

0,47

tDeficitD*

30,46

25,06

I

-62≤38

0

13,87

I

0,41

tDebito

26,66

21,76

III

-60≤40

3,7

11,90

III

0,31

tInflazione

24,65

18,53

IV

-72≤28

0

12,82

II

0,76

tOccupazione

26,65

22,13

II

-52≤49

3,7

8,93

V

0,18

* tDeficitD = distanza di tDeficit da zero

In questo secondo caso si può verificare che l’effettoquadratico contrae gli scarti centrali dell’1,5%, in media, mentre dilata il 98,5% di quelli laterali. La deviazione robusta, non concorda con la deviazione assoluta, δ, come nel caso precedente. L’effetto sovrastima equivale al precedente.Il caso Pnp robusto indica come prioritari gli interventi su Deficit e Inflazione (non su Inflazione e Pil come nel caso standardizzato).

Last updated

Copiright © 2024 Gabriele Stoppa | blog.gabriele.pro | Tutti i diritti riservati.