Opzioni di Borsa in laboratorio – 37 – RQ e SLOPE in Excel (2^ parte)
Come abbiamo visto la volta scorsa, la regressione lineare non sempre è in grado di spiegare i movimenti di Borsa che sono erratici per natura. A questo scopo la funzione RQ ci aiuta a conoscere il livello di affidabilità della retta di regressione.
Abbiamo detto che RQ misura il grado di bontà della regressione lineare, ovvero il fitting.
Detto in termini ancora più semplici: RQ è l’arbitro della regressione lineare.
Poiché RQ dipende dal Dominio impiegato e può fluttuare:
- tra 0 (il modello utilizzato non spiega per nulla i dati)
- e 1 (il modello spiega perfettamente i dati)
possiamo tentare una verifica su una serie storica corposa partendo da un dominio basso (per esempio 5 giorni) e salendo via via fino a 6 mesi.
Nel nostro caso, utilizzando il valore inferiore 5, copriamo una settimana lavorativa mentre col valore più alto 120 arriviamo a 168 giorni di calendario, cioè quasi a sei mesi.
Questi sono i domini sui quali si svolgerà la nostra indagine: 9 intervalli tra 5 e 120 sedute.
Ora è importante fare questa osservazione:
- quando il dominio è basso, l’indice di bontà RQ sarà alto
- al contrario, con domini alti, RQ sarà basso
Per esempio: con dominio = 5 mi aspetto una buona risposta di RQ (cioè valori abbastanza vicini a 1) mentre quando userò il dominio 120 avrò valori di RQ sempre più sballati, valori cioè che si allontanano da 1 e si avvicinano a 0.
Il perché è intuitivo: se la tenaglia di osservazione è di una sola settimana, a parte casi molto particolari, il valore della regressione sarà lì nei pressi dell’Indice ma se la mia indagine si estende a un periodo più ampio, allora lo scarto Indice/Regressione aumenterà considerevolmente e RQ (che misura la bontà della stima) sarà sempre più lontana da 1 e sempre più vicina allo zero.
L’esempio della via Ferrarese è ancora una volta convincente: l’indagine tra paeselli vicini (Cà de’ Fabbri e Altedo) è molto facile ma quella tra gli estremi (Bologna e Ferrara) sarà molto più complessa.
Dopo aver stabilito le 9 fasce di indagine (domini = 5, 10, 14, 20, 25, 30, 50, 60 e 120) chiediamo aiuto alla letteratura che ha già stabilito <deo gratis> i valori critici per ciascun dominio. Non solo: oltre ai <critical value> qualcuno al posto nostro ha anche stabilito il livello cosiddetto di ‘confidenza’ per quegli specifici valori critici.
Nota:
In statistica, la confidenza (o anche ‘intervallo di fiducia’) rappresenta l’intorno dei valori plausibili per un certo parametro statistico. L’impostazione di questa congettura si deve a Jerzy Neyman (Moldavia 1894 / California 1981).
Da tenere presente: una confidenza del 100% significa certezza, al contrario 0% è assoluta incertezza.
Vediamo dunque la tabella che mostra i “critical values” espressi al 95% di confidenza tratta dalla letteratura: il nostro compito sarà quello di verificarli sul nostro Indice FTSEMIB.
Per poter effettuare un test convincente, utilizziamo una serie storica di 2211 valori di Borsa: dal 2 gennaio 2004 al 10 agosto 2012.
Per iniziare, memorizziamo in testata i successivi Critical Values dei singoli domini.
Otteniamo così l’intestazione del nostro foglio Excel:
…e, a capo (per motivi di spazio):
Ricordando che la sintassi della funzione RQ in Excel è: RQ(y_nota;x_nota) possiamo calcolare i corrispondenti RQ.
Nota per i programmatori Excel:
Si utilizzano le funzioni “INDIRETTO e INDIRIZZO” specifiche per la riga mobile.
A titolo di esempio potete cliccare la cella D10 dell’esercitazione per ottenere la formula: =SE(RIF.RIGA()<5+D$2;"";
RQ(INDIRETTO(INDIRIZZO(RIF.RIGA()-D$2+1;2)):INDIRETTO(INDIRIZZO(RIF.RIGA();2));
INDIRETTO(INDIRIZZO(RIF.RIGA()-D$2+1;3)):INDIRETTO(INDIRIZZO(RIF.RIGA();3))))
Ogni volta che RQ supera il corrispondente critical value, marcheremo l’evento scrivendo ok nella riga corrispondente.
Vediamo cosa accade con il dominio 5 a partire dal 2 gennaio 2004:
Nelle prime quattro sedute, dal 2 al 7 gennaio, non succede assolutamente niente perché non abbiamo ancora i dati necessari per il calcolo di RQ a cinque sedute.
L’8 gennaio abbiamo finalmente il carico sufficiente di 5 sedute per trovare il corrispondente RQ che risulta 0,0087.
Questo valore è inferiore alla soglia consigliata di 0,77 quindi non lo marcheremo.
Fino al 15 gennaio i valori di RQ sono sempre inferiori a 0,77 ma il 16, il 19 e il 20 abbiamo tre risultati validi che andremo a marcare con l’ok.
Estendendo il calcolo ai domini successivi si ottiene questo copia-incolla di esempio:
E’ chiaro che più sale il dominio e più aumentano i giorni necessari al calcolo, tanto che, per far partire l’impianto complessivamente, occorrono 120 sedute di Borsa, cioè occorre arrivare al 17 giugno 2004.
Solo a questo punto possiamo iniziare ad estrarre i primi risultati statistici.
Il passo da fare adesso è abbastanza intuitivo: andiamo a rintracciare gli eventi in cui tutti gli RQ erano contemporaneamente oltre la soglia di criticità.
La mossa è sensata: se tutti i 9 RQ sono ‘buoni’, ciò significa che quelle sedute di Borsa erano ‘particolari’ e sul significato del termine ‘particolare’ faremo più avanti tutte le osservazioni del caso.
Allo scopo, inseriamo la nuova colonna “V” degli Eventi Contemporaneamente Soddisfatti:
… andiamo a capo come al solito:
Il 26 agosto 2004, per la prima volta nella colonna degli ‘Eventi Contemporaneamente Soddisfatti” troviamo il valore 9 evidenziato in verde.
La nuova colonna “W” ‘Eventi singoli’ ad ogni nuovo evento riporta il valore 1 che ci servirà per i conteggi finali.
Nota:
Il valore 9 può rimanere vivo per più di una seduta di Borsa ma verrà conteggiato una volta soltanto nella colonna Eventi Singoli.
A questo punto siamo in grado di totalizzare i nostri risultati scoprendo la riga 4 del nostro foglio di lavoro:
… e, a capo:
Conclusione: in 2091 sedute (dal 17 giugno 2004 al 10 agosto 2012) ci sono stati 55 casi in cui tutti gli RQ dei 9 domini erano contemporaneamente oltre il corrispondente critical value.
Per capirci un po’ di più, possiamo subito estrarre le date dei 55 risultati ordinati in colonne annuali in modo da poter interpretare il contesto oggettivo:
La prima cosa da osservare è la diversa distribuzione degli eventi nel tempo: passiamo cioè da ben 13 eventi nel corso del 2005 a un solo evento nel 2010 e questo dato ci disorienta un po’ perché il trader di Borsa deve poter disporre di segnali continui e regolari.
Il sistema è dunque irregolare nel tempo.
Per poter comprendere realmente come si sono svolti i fatti, creiamo una nuova tabella con queste informazioni: Data, Close, Performance e Timing del periodo.
Una volta compreso il fatto che un Sistema simile non è facilmente praticabile per via della instabilità dei segnali, vediamo comunque di interpretare se a questi corrisponde almeno un effettivo punto di svolta importante del mercato perché se così fosse, potremmo accontentarci di aver rintracciato almeno i ‘punti estremi’ pur rinunciando alla linearità della frequenza.
La tabella mostra le date salienti calcolate dal programma.
Vediamo:
No, purtroppo non è come avremmo sperato: i punti di svolta di questo schema non corrispondono quasi mai ad estremi importanti di periodo.
La nostra conclusione si conferma amara ma l’esercitazione è comunque servita a mettere in cantina un’ipotesi che sembrava allettante e ampiamente confortata dalla letteratura come si ricava da questo stralcio:
“…To determine if the trend is statistically significant for a given x-period linear regression line, plot the r-squared indicator and refer to the following table.
This table shows the values of r-squared required for a 95% confidence level at various time periods.
Number of Periods R-squared Critical Value (95%confidence)
5 0.77
10 0.40
14 0.27
20 0.20
25 0.16
30 0.13
50 0.08
60 0.06
120 0.03
Prima di concludere l’argomento Regressione Lineare dovremo ancora indagare in merito al rapporto RQ / SLOPE che vi suggerirei di seguire attentamente nel corso della prossima lezione.
Non mancate all’appuntamento su www.francescocaranti.net
Francesco Caranti