Opzioni di Borsa in laboratorio – 22 – Varianza e Deviazione Standard in Excel

rubrica: 


E’ singolare come mi sia trovato ad apprezzare la deviazione standard in conseguenza a una reale necessità pratica: fu allora che ne capii tutta l’importanza.
Vi riporto la mia la storia, convinto che possa far presa anche su di voi.

… anni fa, in azienda, dovetti valutare l’assunzione di una squadra di tecnici che erano stati sottoposti a un test attitudinale: occorreva scegliere una delle 3 squadre che chiameremo A, B, C ciascuna di 6 periti meccanici.
La votazione di ciascun candidato era espressa in centesimi, cosicché 100 era il massimo e 0 era il minimo.
Ovviamente bisognava scegliere la squadra migliore ma quando la commissione mi consegnò le votazioni definitive per prendere una decisione, caddi nel dubbio.


Pensai subito alla cosa più elementare, cioè quella di fare la media aritmetica dei voti delle 3 squadre in lizza, ovviamente per scegliere il punteggio più alto.
Purtroppo la votazione media risultò identica: 81,5 per ogni squadra.
Vediamo:


Che cosa avreste fatto voi con questi punteggi praticamente identici?
Apparentemente le 3 squadre erano in sostanziale parità.
Possibile che fossi stato così sfortunato? Non c’era forse un altro modo ‘scientifico’ per assegnare l’assunzione ad A, B oppure C <mettendo da parte altre valutazioni soggettive e umane, ovviamente>?
Mi venne in mente allora di essermi imbattuto in passato con le congetture di un matematico russo, al secolo Pafnutij L'vovič Čebyšëv che, cent’anni prima di me, si era posto <e contrariamente a me, aveva risolto> un problema simile al mio, ormai noto come il teorema di Chebyshev. E siccome in matematica molto spesso si è arrivati a risolvere lo stesso problema partendo da congetture diverse, ancora oggi non si sa se la soluzione venne prima da Chebyshev oppure dal francese Bienaymé, suo contemporaneo. E vabbè: queste sono cose di poco conto.
Tornando a noi: che fare? Si dovevano forse pesare diversamente gli ultimi risultati rispetto ai primi? Oppure fare la media della media? Chissà!
Per risolvere la questione dobbiamo chiedere aiuto alla Statistica e alle sue leggi.
Procediamo così, partendo dalla squadra A (il ragionamento sarà valido anche per le altre):
 
Cominciamo col fare la media aritmetica (73+76+77+85+88+90) / 6 = 81,5 in verde:

Poi, per ogni partecipante, calcoliamo la differenza tra il suo punteggio e la media: colonna azzurra. Che cosa rappresenta questa colonna?  Ma certo, altro non è che lo scarto, rispetto alla media, di quanto uno sia più o meno bravo degli altri.
Per enfatizzare questo ‘scarto’, lo eleviamo al quadrato e otteniamo la colonna blu.
Siamo arrivati alla fine: sommiamo e dividiamo per 6.


Così:

Senza volerlo abbiamo ricavato un valore che si chiama VARIANZA.
La Varianza è l’indice statistico che fornisce la misura di quanto i valori assunti dalle variabili si discostano dalla loro media.
In pratica la varianza è la misura della “dispersione” dei valori ottenuti in prove diverse in modo che maggiormente differenti sono i valori ottenuti in più prove e maggiore sarà il valore della varianza. Questo è il motivo per cui la varianza è chiamata anche indice di dispersione poiché offre una indicazione sull'addensamento dei valori della variabile attorno al valor medio. Se  abbiamo una varianza alta in una prova d'esame, allora vorrà dire che ci saranno voti molto diversi tra di loro. Viceversa, se la varianza ha un valore basso, i voti ottenuti sono pressoché equivalenti con la conseguenza che il livello di preparazione degli allievi è omogeneo.
Se dunque uno dei possibili criteri di scelta nelle assunzioni di una squadra è l’omogeneità <criterio decisamente affidabile> possiamo calcolare la varianza dei 3 gruppi e scegliere la squadra con varianza più bassa.  Vediamo:

La squadra da scegliere sarà la “A” che ha la varianza più bassa in assoluto: la squadra A è, statisticamente parlando, la più omogenea tra le 3 squadre.
 
Nota: non so se ve ne siete accorti, ma la media 81,5 del nostro esempio è una SMA, simple moving average, già conosciuta nelle dispense precedenti … ma ci torneremo molto presto.
 
Nota: le formule per il calcolo della varianza in Excel sono 2, poiché due sono le metodologie ufficiali che si possono adottare:

 

  • VAR.POP(num1;num2;...)             

          
 VAR.POP presuppone che gli argomenti siano l'intera popolazione. 

  • VAR(num1;num2;...)          

VAR presuppone che gli argomenti siano un campione della popolazione. 
La differenza sta nel denominatore: n al quadrato in VAR.POP e n(n-1) in VAR
Nel caso delle serie storiche di Borsa si deve scegliere VAR.POP


Per tornare a ciò che ci interessa più da vicino, quello che abbiamo scoperto oggi è un ulteriore passo avanti nell’indagine delle caratteristiche delle serie storiche di Borsa.
Ciò che voglio dire è che i dati di Borsa, così come tutte le sequenze della statistica, possono essere valutati indagando su fronti diversi: dalla semplice media mobile, a quella esponenziale e via via fino alla Regressione Lineare dei capitoli precedenti e alla Varianza di oggi.
E’ un po’ come ammirare un quadro e scorgere questa o quella visione che l’artista ha voluto esprimere. Ciò non significa che la Varianza sia da preferire alla media semplice <o viceversa>; significa invece che ci saranno casi in cui seguiremo una strada e casi in cui sarà più giusto prenderne un’altra.
 
Attenzione: la varianza non è un Indicatore ma è solo un Indice
Che differenza c’è? E’ solo un modo di dire o i termini rappresentano concetti realmente diversi?
Esatto! Sono cose molto, ma molto diverse.
In parole più semplici, l’Indicatore è equiparabile a un vero e proprio segnale di Borsa (se sale farò Enter Long, se scende Enter Short).
L’Indice , invece, rappresenta il valore di una grandezza, nel nostro caso il valore della dispersione.
Mentre l’Indicatore è per così dire ‘tradabile’, l’Indice è e sarà solo un ‘ingrediente’ da utilizzare all’interno di un Indicatore, come per esempio le Bande di Bollinger che contengono la Deviazione Standard (la vedremo) all’interno della formula.
 
Oggi abbiamo visto un nuovo modo di interpretare i dati statistici attraverso un Indice di dispersione, cioè mediante il maggiore o minore addensarsi attorno ai valori medi.
Vedremo presto il concetto successivo alla Varianza: stiamo parlando della Deviazione Standard, alias Scarto Quadratico Medio … un modo un po’ diverso per riferirsi comunque allo stesso concetto.
 
Non mancate di seguire l’evoluzione sempre qui su www.francescocaranti.net
 
Francesco Caranti