Opzioni di Borsa in laboratorio – 32 – Minimi quadrati in Excel

rubrica: 

Nei contributi 18, 19 e 20 abbiamo parlato a lungo della Regressione Lineare e già la volta scorsa siamo tornati sull’argomento.
Approfittando di un esempio fantasioso di un ipotetico lago inquinato a Topolinia, abbiamo verificato che esistono due funzioni Excel che producono gli stessi risultati: PREVISIONE e TENDENZA e ciò che già sappiamo è che il meccanismo di calcolo si basa sul metodo dei minimi quadrati di Gauss.

La Regressione Lineare è una retta, anzi la miglior retta, in grado di passare nel modo ottimale tra i ‘punti sperimentali di osservazione’. Una retta del genere si definisce ‘interpolante’.
Ovviamente l’utilizzo dell’interpolante sarà quello di andare oltre il campo di osservazione, estrapolando cioè le previsioni che ci servono.
Dovete sapere che dalle mie parti esiste la vecchia ‘Ferrarese’ cioè una strada che congiunge Ferrara a Bologna. Ebbene, la Ferrarese è un esempio che oggi cade a fagiolo perché qui da noi per dire che un certo tragitto <o anche un discorso> è tortuoso e comunque poco lineare, si dice che è come la Ferrarese.
Una ragione c’è: quando tracciarono quella strada si trovarono a fare i conti con mezzadri, contadini, latifondisti e proprietari terrieri i quali si rifiutarono categoricamente di farsi espropriare le terre, i casali e le corti, cosicché gli ingegneri di allora furono costretti a “raggirare” quelle proprietà fino a creare una strada dal tipico andamento sinuoso fatto di curve e di bisce.  Ben diversamente sarebbe andata se ai costruttori fosse stato concesso di abbattere quei possedimenti e costruire una ‘interpolante’ snella e rettilinea.
Ecco il nesso: la Ferrarese è l’insieme dei punti delle nostre osservazioni sperimentali (le cascine e i casali) mentre la Regressione Lineare è quell’ipotetica strada maestra che compie il miglior tragitto possibile, cioè quello rettilineo.
Tornado a ciò che ci interessa maggiormente, sulla Regressione Lineare applicata alla Borsa abbiamo parlato bene ma anche meno bene: pregi e difetti di tutti gli Indicatori.
In senso positivo, della Regressione Lineare abbiamo speso buone parole definendola molto potente e molto veloce, di contro occorre saperla interpretare poiché tende ad essere un po’ instabile e come tale dovrà essere supportata da altre indicazioni, come vedremo più avanti in questa rubrica.
Nota: Perché, direte voi, tornare ancora sulla Regressione Lineare? Non bastava sapere che esiste e che gode di certe proprietà? Perché non fermarsi qui?
La risposta è molto semplice: la regressione lineare è uno dei capisaldi della Statistica Descrittiva <la parte della Statistica di cui ci stiamo occupando> e se anche non fosse proprio questa regressione lineare a fornirci i risultati migliori in Borsa, ciò non importa perché quel che veramente conta è l’impostazione e la metodologia delle regole e dei principi della statistica. Voglio dire, per esempio, che finché non riuscirò a interiorizzare i minimi quadrati di Gauss, la mia confidenza coi numeri sarà ancora scarsa e difficilmente riuscirò a fare qualche previsione  sensata.
 
Riguardo al metodo dei minimi quadrati, nel contributo 19 ce la siamo cavata con poco sforzo dato che siamo arrivati ai risultati tramite il metodo di sostituzione che, per quanto elementare, è comunque complesso e rudimentale.
Quello che vedremo oggi è invece la soluzione classica attraverso il metodo ufficiale di Gauss, il tutto applicato alla Borsa a suon di celle e a suon di formule.
Via! Si parte! 
Si comincia col copia-incolla del contributo “Opzioni in laboratorio – 20 – LRI in Excel”.

Il dominio è 14 e il 19 gennaio Excel restituisce il valore 15201,83 a fronte di una chiusura a 15651.
Il nostro obiettivo è la verifica di 15201,83 partendo dalla formula.
Iniziamo con questa tabella della simbologia e delle formule:

 Nota:
La lettera Sigma maiuscola rappresenta una Sommatoria.
Attenzione a non confondere (Σx)con  Σx2 : questo esempio dei primi 14 valori di X può chiarire.

 


Nota:
Nella dispensa 19 avevamo già accennato all’equazione della retta. Riporto uno stralcio:
“… la volta scorsa abbiamo detto che a fronte di un esperimento di osservazioni di coppie di valori campione (il tempo e la velocità di una biglia) è possibile tracciare una retta che rappresenta la soluzione ‘approssimata migliore’. Poiché qualsiasi retta del piano è rappresentata sempre da una equazione del tipo Y=a+bX, il compito di oggi sarà quello di calcolare ‘a’ e ‘b’ tramite il metodo scoperto da Gauss / Laplace a fine 700 …”.
In realtà in quel contributo avevamo risolto il problema solo empiricamente, cioè ‘mettendo a Sistema’ una serie di informazioni di tempo e velocità della biglia. Eravamo poi arrivati alla soluzione tramite il ‘metodo di sostituzione’ o <come solo accennato> attraverso la matrice di Cramer.
Questa volta è diverso perché non partiamo più dai dati sperimentali per trovare l’equazione ma ci arriviamo direttamente dall’enunciato di Gauss, cioè dalle due formule riportate al termine della tabella “Simbologia”.
 
Concludendo, pare proprio che io debba trovare i due termini:
 

  • “a”
  • “b”

… perché a quel punto basterà sostituirli in Y=a+bX e il gioco sarà fatto !!!
 
Come al solito partiamo dalla fine e controlliamo il copia-incolla delle colonne U,V,W dell’Excel allegato:

In colonna U c’è il coefficiente angolare ‘b’ = 13,0066, in colonna V  l’ordinata all’origine ‘a’
Poiché il nostro esempio si riferisce alla regressione lineare del FTSEMIB a 14 giorni, operando la sostituzione si ottiene:
 

= 15019 + (13,0066 x 14) = 15201,83

 
Perfetto: abbiamo capito!
L’importante è trovare ‘a’ e ‘b’ , dopodiché la retta è perfettamente individuata.
 
Ora però andiamo con ordine, partendo dall’inizio del nostro foglio Excel (i copia-incolla che vediamo sono forzatamente divisi in blocchi per motivi di spazio).

Le prime 7 colonne (fino a G) sono le stesse della dispensa 20 e calcolano la regressione lineare tramite la formula =PREVISIONE. Vi ricordo che il dominio è 14.
Le colonne da H a L sono state spiegate nella Nota.
Il nostro compito resta quello di ritrovare il valore 15201,83 senza usare =PREVISIONE ma tramite i passaggi successivi dell’equazione di Gauss.
 
Ora scopriamo le colonne da M a R la cui intestazione dovrebbe essere chiara.
Vi ricordo che X è il tempo e Y le chiusure di Borsa.

E infine vediamo le colonne da S a X:

 

Tutto quadra: in colonna W ricompare 15201,83 … e per sicurezza abbiamo inserito la colonna X che riporta il risultato ottenuto con la formula =TENDENZA anziché =PREVISIONE di colonna G.
 
Mi fermo qui per non appesantire.
La prossima volta concluderemo lo studio tramite l’estensione di questo foglio Excel per vedere il collegamento con le altre funzioni statistiche:


 
Appuntamento sempre qui, su www.francescocaranti.net
 
Francesco Caranti