Dati finanziari ad

Trattamento e applicazioni
Massimiliano Cecconi, Marco J. Lombardi

alta frequenza

Università degli Studi di Firenze - Dipartimento di Statistica "G. Parenti"

U

na delle tendenze più moderne della finanza consiste nello studio dei cosiddetti dati ad alta frequenza, ovvero osservazioni registrate in tempo reale sui mercati. A differenza degli studi tradizionali, nei quali si tende a considerare dati misurati ad intervalli equispaziati, nel caso dell’alta frequenza si registra ogni singola transazione (e anche richiesta di transazione) che avviene sul mercato. La possibilità di sfruttare questa enorme mole di informazione costituisce un indubbio vantaggio; le applicazioni di stime econometriche ricavate da dati ad altissima frequenza (ultra-high frequency, Engle [4]) si riflettono su gran parte della moderna teoria finanziaria: dal prezzaggio di opzioni alla previsione della volatilità intragiornaliera, dal calcolo del Value at Risk alla gestione della liquidità. Tuttavia, l’impiego di tali dati pone delle difficoltà sia per quanto concerne la loro raccolta che il loro trattamento. Difatti, oltre al problema di gestire ed organizzare enormi quantità di osservazioni (si può anche arrivare ad alcune migliaia di registrazioni nell’arco di una sola giornata borsistica), si pone quello del trattamento di osservazioni a frequenza irregolare. Una delle possibilità che sta riscuotendo maggior successo in letteratura consiste nel modellare i tempi che intercorrono tra una transazione e l’altra (le cosiddette durations) tramite un nuovo processo, introdotto da Engle e Russell [5] e noto con l’acronimo di modello ACD (Autoregressive Conditional Duration). Tra le motivazioni che hanno ispirato i due autori vi è la constatazione che la presenza sul mercato di operatori maggiormente informati di altri si riflette in un tempo medio di attesa tra una transazione e l’altra relativamente breve. Viceversa, tempi di attesa più lunghi sono indice di una maggiore calma dei mercati, poiché si ritiene che il prezzo corrente sia prossimo al suo valore di equilibrio. Scopo di questo articolo è quello di presentare sinteticamente i dati ad alta frequenza, le problematiche connesse al loro stoccaggio ed al loro trattamento, e di fornire alcuni spunti sulle possibilità di utilizzo dei dati in svariati ambiti della moderna teoria finanziaria.

Scienza & Business, Anno III, n.9-10, 2001

17

Una delle ultime conseguenze della rapida espansione della tecnologia hardware è rappresentata dalla possibilità di archiviare e gestire database di dimensioni imponenti grazie alla costante crescita di capienza dei supporti magnetici e all’introduzione su larga scala (e a costi contenuti) degli strumenti ottici di lettura/scrittura. In letteratura. si sta diffondendo oggi la pratica di sfruttare la massima informazione possibile utilizzando i dati tick-by-tick. si suole considerare il prezzo di chiusura come indicativo dell’intera giornata di contrattazioni. Difatti. sul mercato italiano. ma che ad ogni modo la serie ad alta frequenza veicola una quantità di informazione infinitamente maggiore rispetto a quella giornaliera. 2001 . utilizzando dati giornalieri.000 rilevazioni. Marco J. è immediatamente evidente che. utilizzando dati giornalieri. nel caso italiano. Lombardi . nel formato hhmmsscc (ad esempio 11073200 indica le ore 11. a partire dall’inizio degli anni ‘90.9-10. le due serie risultano più o meno sovrapponibili. n. Modalità di raccolta e gestione dei dati I dati ad altissima frequenza sono raccolti e forniti da organismi di vario tipo.p. Ad esempio. ciò rende possibile studiare l’andamento dei mercati in una prospettiva intragiornaliera. ad esempio. Una tipica giornata di contrattazioni. 32 secondi). ovvero registrare tutte le transazioni (eseguite o solo richieste) che si rilevano sui terminali degli operatori. Al contrario. Il problema principale consiste nel fatto che le osservazioni così rilevate non sono necessariamente equispaziate: tra un’osservazione e l’altra può intercorrere un lasso di tempo che oscilla da pochissimi secondi a qualche mi- nuto. ! volume scambiato. Figura 1 Prezzo del titolo FIAT nel periodo 10/31 luglio 2000 sulla base di rilevazioni giornaliere Figura 2 Prezzo del titolo FIAT nel periodo 10/31 luglio 2000 sulla base di rilevazioni tick-by-tick 18 Scienza & Business.Massimiliano Cecconi. nel formato aaaammgg (ad esempio 20000703 indica il 3 luglio 2000). Se fino a poco tempo fa le applicazioni si limitavano a considerare al massimo osservazioni giornaliere.A. Nella Figura 1 riportiamo i prezzi giornalieri di chiusura. ! orario della transazione.Dati finanziari ad alta frequenza L a modernizzazione degli strumenti informatici è spesso venuta a coincidere con importanti innovazioni nel campo della finanza. essi sono gestiti direttamente dalla Borsa Italiana S. si sono potute sviluppare tecniche di prezzaggio per titoli derivati di tipo non standard basate sulla simulazione del prezzo del titolo sottostante. Anno III. spesso identificabili con l’istituzione che gestisce e regola il singolo mercato nazionale. ma ciò non è necessariamente vero. Tuttavia. supera abbondantemente le 1500 osservazioni. In ambito finanziario. ! controvalore in euro. ! prezzo in euro al quale avviene lo scambio. tale problema non si pone. La non omogeneità dei dati tick-by-tick non risulta molto evidente dalla Figura 2 a causa della enorme quantità di dati a disposizione (29087 osservazioni). Si capisce subito come ciò risulti costoso sia dal punto di vista dello stoccaggio che da quello del trattamento dei dati: un database di un anno consterebbe di circa 600. Dai grafici che presentiamo possiamo vedere un confronto tra l’andamento giornaliero e quello tick-by-tick del prezzo del titolo FIAT tra il 10 e il 31 luglio del 2000. utilizzare questo tipo di dati pone alcuni problemi e rende necessario ricorrere a strumenti parzialmente diversi da quelli tradizionalmente impiegati. ovviamente. Tuttavia. Si osserva che. Tali dati si presentano sotto forma di database in formato ASCII che riporta in ordine: ! data della transazione.7 minuti. mentre nella Figura 2 il grafico delle quotazioni tick-by-tick. tralasciando i movimenti intragiornalieri del prezzo si rischia pertanto di trascurare informazioni rilevanti ai fini della stima e della previsione. la crescente velocità di elaborazione dei processori ha reso possibile sviluppare tecniche di analisi che risultavano in precedenza impensabili: tra le altre cose. spesso si indicano tali rilevazioni come dati tick-by-tick o trade-by-trade (Gwilym e Sutcliffe [6]).

che cura il database TAQ (Trades and Quotes. questo non è il caso delle osservazioni ad alta frequenza. Lombardi . l’American Stock Exchange (AMEX) e il Chicago Board Options Exchange (CBOE). 2001 19 . invece. ciascun punto indica una diversa transazione avvenuta nel periodo considerato. sono rilevati anche dati di altri mercati. ne riportiamo. ugualmente. Marco J. si veda. tra cui il National Association of Securities Dealers Automated Quotations (NASDAQ). è immediatamente visibile l’andamento a “salti” della serie dovuto alla diversa frequenza con cui si registrano le transazioni. La seconda transazione.30 e le 10. Hamilton [7]) è quindi applicabile solo nel caso in cui i dati siano equispaziati e.9-10. La Figura 3 illustra quanto descritto per il titolo FIAT nel giorno 10 luglio 2000 tra le 9. Dal grafico si evince che la frequenza degli scambi sul mercato statunitense è in forte crescita: la dimensione del database presenta difatti un marcato trend crescente sia per quanto riguarda le proposte immesse nel circuito telematico che per quanto riguarda le transazioni effettivamente realizzate.Dati finanziari ad alta frequenza se concentriamo l’attenzione su una frazione della giornata borsistica (ad esempio un’ora). essa ovviamente coincide col prezzo di apertura. a un prezzo di 104. x1. Una prima idea può essere quella di Scienza & Business. per quanto riguarda le osservazioni giornaliere. Per quanto riguarda x0. su quello statunitense è infinitamente più grande: non solo le transazioni sono molto più numerose. si registra la prima transazione a un prezzo di 101. per una trattazione introduttiva. e così via. oltre alle transazioni che effettivamente hanno luogo (trades). oppure ogni secondo. Supponiamo che il prezzo di apertura del titolo che vogliamo analizzare sia 100. Se il problema del trattamento dei dati si avverte già sul mercato italiano. Questo approccio comporta però alcuni problemi: se infatti. dopo 2 minuti e 36 secondi (2. Tale modellistica (ci riferiamo in partico- Figura 4 Dimensione in MegaBytes del database TAQ Figura 3 Prezzo del titolo FIAT tra le 9. ovvero le proposte di vendita e di acquisto che non vanno a buon fine (quotes). e dobbiamo quindi procedere in maniera diversa. a un prezzo di 102. La modellistica tradizionale che si è soliti utilizzare per l’analisi delle serie storiche finanziarie è stata sviluppata quando ancora le osservazioni giornaliere rappresentavano il massimo grado di informazione che si potesse riuscire a gestire. x1 coincide col prezzo di tale transazione. Dopo esattamente un minuto dall’apertura del mercato.8 minuti) dopo l’apertura del mercato. ma l’insieme delle informazioni rilevate risulta molto più ampio. La situazione che ci si trova ad affrontare è schematizzata nella Figura 5: a partire dalla prima linea temporale. come abbiamo visto. che illustreremo con un semplice esempio grafico. [12]). le dimensioni in MegaBytes per alcuni mesi di riferimento e solo per pochi titoli azionari del NYSE. Per quanto riguarda x2. a partire dalle osservazioni tick-by-tick. Nel database TAQ. ovvero 101. oltre ai dati relativi al NYSE. L’idea più naturale in questo senso è quella di registrare i dati a intervalli di tempo predefiniti: ad esempio ogni minuto. 30 del mattino. in Figura 4.6 minuti). anche le quotazioni bid e ask. dobbiamo costruire la seconda. una serie di osservazioni equispaziate a un minuto. n. Per dare un’idea della mole che può raggiungere il database TAQ. I primi studi in tale ambito si sono concentrati sul cercare di “recuperare” la modellistica tradizionale trasformando le osservazioni ad alta frequenza in osservazioni equispaziate. “riempiendo” le rilevazioni x0. I dati devono essere quindi trattati in modo da renderli veramente equispaziati. poiché la prima transazione si è verificata esattamente un minuto dopo l’apertura del mercato. non disponiamo di un’osservazione corrispondente al termine temporale dei 2 minuti. avviene 1 minuto e 48 secondi (1.30 del 10 luglio 2000 lare ai modelli di tipo ARMA-GARCH. non equispaziata. 30 e le 10. Tale database riporta. e la terza. Vi sono varie modalità di intervento possibili. non è detto (specie per quanto concerne i titoli a minore flottante) che si possa osservare una transazione esattamente ogni minuto (o addirittura ogni secondo). al termine della giornata di contrattazioni si osserva comunque un singolo prezzo di chiusura. Il principale fornitore di dati per il mercato statunitense è il New York Stock Exchange (NYSE) stesso. Desideriamo ricavare.Massimiliano Cecconi. x2. Anno III.

Ovviamente. si può considerare la media aritmetica delle osservazioni immediatamente precedente e seguente ai 2 minuti. Il secondo passo consiste nell’utilizzare i fatti stilizzati precedentemente individuati per formulare adeguati modelli matematico-statistici.1.8) + (2.102): (2 . individuazione di patterns giornalieri e/o settimanali caratteristici. Nell’ultima fase occorre verificare l’adeguatezza del modello nel riprodurre i fatti stilizzati precedentemente individuati sui dati. più raffinata.1.8). L’approccio comunemente utilizzato in questo ambito è quello proprio delle scienze sperimentali (fisica. è quella di considerare una media ponderata con gli intervalli di tempo che intercorrono tra le transazioni e il termine dei 2 minuti: x2 = [102 * (2 . chiunque si avvicini ai mercati finanziari possa disporre di enormi quantità di dati dai quali estrapolare utili suggerimenti per le proprie decisioni di investimento e disinvestimento. forma della distribuzione campionaria. per quanto alta possa essere la frequenza di campionamento. Lombardi .5. In pratica. Tuttavia. e forse la più delicata.6 . chimica o biologia). che si pone in contrapposizione all’approccio economico tradizionale dove l’aspetto determinante è costituito dalla verifica empirica di quelle relazioni teoriche ritenute esplicative del comportamento dei mercati (la cosiddetta microstruttura). La prima di esse. ma non è necessariamente superiore alle altre in termini di risultato. una perdita di informazione.1. Occorre notare che per modelli adeguati si intendono formulazioni rigorose in grado di riprodurre le regolarità empiriche osservate.8) + 104 * (2. possiamo sfruttare tutta la modellistica preesistente.1.6 . disponendo di dati equispaziati. in questo caso 102. dove i fenomeni naturali vengono studiati mediante l’ausilio di strumenti matematici e statistici rigorosi. questa strategia può rivelarsi non ottimale a fini di analisi. La media ponderata è quella che considera il numero più ampio di fattori. Si va dunque alla ricerca di quelle regolarità empiriche che nella letteratura econometrico-finanziaria prevalente vengono definite fatti stilizzati. n. La presenza di operatori diversamente informati gioca un ruolo L’approccio sperimentale alle serie ad alta frequenza I n ciò che precede abbiamo messo in evidenza come oggigiorno.102): (2. sono solo alcuni degli esempi di regolarità empiriche ispezionate in questa fase. Quello che vale la pena qui osservare è che procedere ad accorpare i dati per renderli equispaziati comporta comunque. consistente nel tracciare una retta per le due transazioni più prossime a quella “mancante” e prendere come valore quello appartenente a tale retta in corrispondenza dell’istante considerato. cercatore allo scopo di individuarne le proprietà statistiche fondamentali.2)] = 103. Altrimenti.Massimiliano Cecconi. ovvero: x2 = (102 + 104) / 2 = 103. [3]). Anno III. Marco J. se si aggiunge a questo indubbio vantaggio l’inconveniente relativo alla perdita di informazione. Menzioniamo. il metodo sperimentale si contrappone a quello proprio della teoria finanziaria tradizionale utilizzato per comprendere la microstruttura del mercato e volto ad analizzare la reazione dei mercati finanziari all’insorgere di nuova informazione. consiste nell’analizzare da un punto di vista esplorativo e descrittivo i dati a disposizione del riScienza & Business. ciò si traduce nel risolvere la proporzione (x2 . Andamento delle funzioni di autocorrelazione. Un’ulteriore possibilità. sulla base di un minimo insieme di assunzioni sottostanti. Tra i problemi maggiori che si incontrano vi è senz’altro la necessità di operare un’adeguata sintesi dell’informazione raccolta in modo da poterla utilizzare al meglio. L’applicazione del cosiddetto metodo sperimentale ai dati finanziari ad alta frequenza si esplica in tre fasi fondamentali (Dacorogna et al. 2001 Figura 5 Costruzione di una serie di osservazioni equispaziate a partire da osservazioni tick-by-tick 20 .9-10.8) = (104 . operando in un contesto di tipo essenzialmente “ateorico”.2)] / [(2 . Abbiamo già rilevato che. Come già evidenziato. integrando nelle applicazioni pratiche questi strumenti con quelli oramai più consolidati del risk management e del prezzaggio di opzioni.5. ma consiste piuttosto nell’utilizzo di tali formulazioni per ricavare ragionevoli previsioni sui loro movimenti futuri. la strada dell’interpolazione lineare.Dati finanziari ad alta frequenza utilizzare la transazione più vicina ai 2 minuti. L’obiettivo finale non si limita alla ricerca di un modello puramente descrittivo dell’andamento dei fenomeni analizzati. tipico delle scienze sperimentali.6 . la cui soluzione rende un valore interpolato per x2 di 102. infine. nessuna di queste metodologie è intrinsecamente la migliore.

ed in parti21 Scienza & Business. il cui vincolo di non-negatività si rende necessario al fine di ottenere stime non negative per ψi . in quanto è proprio dalla previsione di questo dato che gli operatori aggiorneranno la loro opinione (o probabilità soggettiva) circa la possibilità che vi sia informazione superiore nel mercato e che di conseguenza le quotazioni degli attivi finanziari siano relativamente lontane dal loro valore di equilibrio. Come si vede. Basti qui ricordare che se da un lato le peculiarità dei vari modelli consistono nel diver- Figura 6 Durations per il titolo FIAT . e le durate tra la prima transazione della giornata e l’ultima della giornata precedente. a titolo esemplificativo. 2001 . quelle della fase di pre-apertura. sintetizzando la maggiore informazione disponibile in particolari variabili esplicative da aggiungere ai modelli derivati in stretta aderenza alle regolarità empiriche osservate. la rappresentazione formale del modello ACD può essere espressa come segue. α1. Lombardi . Senza entrare nei dettagli dei processi ad intensità condizionale. uno dei principali vantaggi dell’applicazione del metodo sperimentale ai dati ad alta frequenza consiste nella possibilità di riconciliare i due approcci. numerosi sono stati i tentativi di formalizzare il comportamento degli operatori di mercato (si veda.Massimiliano Cecconi. fra gli altri. Partendo da una tale assunzione. riducendo il campione a 35777 osservazioni. β1. . Riportiamo in Figura 6. per i quali si rimanda. Ciò si traduce nel fatto che la quotazione corrente degli attivi finanziari risulta più o meno vicina al suo valore di equilibrio a seconda della frequenza con cui avvengono le transazioni. In tal senso. x1 ). La formulazione matematico-statistica più innovativa volta a tale scopo è senz’altro il modello ACD (Autoregressive Conditional Durations) introdotto da Engle e Russell [5]. O’Hara [11] per una rassegna di tali modelli). è determinato mediante l’applicazione di metodologie statistiche di stima. le considerazioni che portano a ritenere che una maggiore attività di trading si verifichi nelle prime ore successive all’apertura ed in quelle prossime alla chiusura della giornata borsistica è confermata dall’andamento sinusoidale delle durations. il grafico delle durations rilevate per il titolo FIAT nel mese di gennaio 2000. . …. Dal campione sono state escluse le durations nulle (relative al fatto che più transazioni si sono verificate nello stesso istante). Marco J. mentre in prossimità della chiusura gli operatori tenderanno a liquidare eventuali posizioni rimaste aperte o a scontare immediatamente un’aspettativa sulla quotazione alla riapertura.αm ≥ 0. a Lancaster [9]. n. In ciò che segue daremo un semplice esempio illustrativo di modello econometrico derivato secondo le linee guida dell’approccio sperimentale ai mercati finanziari e ne metteremo brevemente in evidenza le potenzialità nel riprodurre le regolarità empiriche osservate su dati reali. so punto di vista in base al quale vengono studiate le sequenze di transazioni. la moderna teoria finanziaria si basa sulla constatazione che l’unica variabile in grado di fornire utili suggerimenti circa la presenza di informazione superiore nel mercato è rappresentata dalla sequenza delle transazioni. In tal modo il modello può essere espresso come: xi = ψi εi dove εi rappresenta una sequenza di variabili casuali indipendenti e identicamente distribuite con funzione di densità di probabilità che deve essere specificata e media uguale a 1. Da queste semplici assunzioni si nota come diverse formulazioni del modello ACD possono essere ricavate semplicemente indicando parametrizzazioni alternative per ψi ed ipotizzando distribuzioni diverse per εi ..βq ≥ 0.Dati finanziari ad alta frequenza chiave nel meccanismo di formazione dei prezzi. Nel modello originario di Engle e Russell [5] si assume che le durations condizionali attese dipendano da q dei loro valori passati e da m ritardi delle durations più un termine costante: Una rappresentazione formale: il modello ACD C ome già accennato in precedenza. contro le 58123 originarie. Si tratta di una rappresentazione statistica per dati non equispaziati la cui finalità è quella di comprendere quale sarà il tempo medio di attesa fino alla prossima transazione. dall’altro il loro elemento comune è l’individuazione della presenza di operatori maggiormente informati di altri. …. I fondamenti di un simile comportamento si ritrovano nella constatazione che all’apertura sia da scontare tutta l’informazione e le opinioni della notte.. xi-2 . ad esempio. Anno III.gennaio 2000 Il valore numerico dei parametri ω > 0. Sia xi = ti -ti-1 l’intervallo di tempo espresso in secondi tra due transazioni consecutive (le cosiddette durations) e sia ψi il valore atteso dell’i-esima duration condizionato a tutta la storia passata di xi (xi-1 .9-10.

nonché la media e la deviazione standard calcolate sui residui del modello stimato Sebbene i residui sembrino. Oltre alle stime dei parametri. la parametrizzazione che meglio si adatta ai dati è quella EACD (1. 2) per il titolo FIAT gennaio 2000 colare del metodo della massima verosimiglianza. L’inclusione tra i regressori di variabili dummy in grado di cogliere questi momenti o la ricerca di variabili esplicative aggiuntive potrebbero in parte rimediare a queste inefficienze del modello.9-10. 1) o la non completa assenza di correlazione nei residui per il caso EACD (1. Marco J. Nei casi più frequenti nella pratica. Figura 7 Istogramma sui residui del modello EACD (1. L’istogramma dei residui osservati (Figura 7). si ipotizza una distribuzione esponenziale o di Weibull per εi . 2). a parte una diversità di scala facilmente eliminabile. il modello è in grado di cogliere quell’andamento sinusoidale di cui si è parlato in precedenza evidenziando un’adeguata discriminazione tra periodi caratterizzati da durate brevi e periodi nei quali i tempi di attesa tra una transazione e l’altra sono significativamente più lunghi. Infine presentiamo in Figura 9 un confronto grafico tra le durations reali e quelle stimate col modello EACD (1. l’ipotesi di distribuzione esponenziale per i termini di disturbo sembra poter essere adeguata. 2001 . In tal caso.Dati finanziari ad alta frequenza (tra parentesi quadre sotto la stima). riproduce abbastanza fedelmente l’andamento della distribuzione esponenziale (la media e la varianza sono infatti prossime all’unità). in linea con le ipotesi teoriche formulate sul modello. 22 Scienza & Business. Ciò è confermato dallo scatterplot tra i quantili teorici della distribuzione esponenziale e quelli ricavati da dalla distribuzione empirica dei residui (Figura 8).gennaio 2000 Inoltre. la statistica test LB di Ljung e Box [10] per la verifica dell’assenza di correlazione. Lombardi . A titolo esemplificativo. dove la disposizione dei punti lungo la bisettrice che passa per l’origine degli assi ne giustifica l’adozione come ipotesi per la stima dei parametri. li rendono di fatto meno accettabili del modello EACD (1. in modo da provocare la sospensione del titolo FIAT dalle contrattazioni per qualche minuto. come si evince dalle figure 7 e 8. una volta che si è specificata la forma della distribuzione di εi . o ci troviamo di fronte a parametri statisticamente non significativi. 2). si riporta nella Tabella 1 la stima di vari modelli ACD di tipo esponenziale per il titolo FIAT all’interno del campione considerato. q) e WACD (m. q). dalle quali derivano rispettivamente i modelli EACD (m. la presenza di pochi valori eccezionalmente grandi può essere dovuta al fatto che la quotazione del momento abbia superato le soglie dell’eccesso di rialzo o di ribasso.Massimiliano Cecconi. riportiamo gli standard error robusti Tabella 1 Stime di vari modelli EACD per il titolo FIAT . n. Anno III. 2). Le maggiori diversità rispetto ad una retta si hanno in corrispondenza di pochi valori elevati per i quali varrebbe la pena dare una spiegazione teorica piuttosto che considerare distribuzioni alternative (quali la Weibull) che avrebbero l’effetto di complicare eccessivamente la procedura iterativa di stima. 1). almeno in prima approssimazione. oppure la presenza di un valore negativo per α2 nel modello EACD (2. Come si vede. Negli altri casi.

Journal of Econometrics. Sono state inoltre proposte numerose estensioni al modello ACD. Persistence in Intertrade Durations. Russell. dei dati ad alta freFigura 9 Confronto tra durations reali (linea rossa) e stimate quenza stessi.. Bibliografia [1] Bauwens. Biometrika. sono stati introdotti modelli in grado di catturare le asimmetrie (Asymmetric ACD. R. J. Gallo per averci supportato e incoraggiato nel nostro lavoro. The Econometrics of Ultra-High Frequency Data. (2001). R. Econometrica. analogamente a liarità. [5] Engle.altri modelli. (2000). O.Dati finanziari ad alta frequenza Pur essendo un modello relativamente recente. nyse. Asymmetric ACD Models: Introducing Price Information in ACD Models with A Two State Transition Model. Anno III.. vi è l’as(linea bianca) per il titolo FIAT . di loro diffusione possa venire proprio cui abbiamo mostrato i tratti salienti dall’introduzione di pacchetti softwaed un’esemplificazione su dati reali. facendo affidamento vorare con dati finanziari ad alta fre.p. S. re specifici.gennaio ristiche empiriche rileva2000 te sui dati reali. in particolare. [9] Lancaster. 66. ovviamente ti giornalieri. Zhang et al. Tsay. C. Giampiero M. html. R. Olsen. [6] Gwilym. M. R. più in generale. In particolare.. anche relative al mercato italiano.ma dei modelli ACD. P (1997). High-Frequency Financial Market Data. P. Bauwens e Giot [2]). An Introduction to High-Frequency Finance. Scienza & Business. n. in letteratura. [8] Jasiak. (2001). Econometrica.. The Econometrics Analysis of Transition Data. http: //www. presentino alcune interessanti pecuRiteniamo che. Notiamo infatti che. per averci cortesemente messo a disposizione i dati ad alta frequenza utilizzati in questo articolo. la memoria lunga (Fractionally Integrated ACD. U. J.. F. 66. R. Tra gli elementi che più frenano una maggiore diffusione della modellistica ACD e. Si è visto come tali dati a causa della loro mole. Box. The Logarithmic . B. J..problematica. Pictet. Bauwens e Giot [1] e Threshold ACD. CORE Discussion Paper 9844: Universitè Catholique de Louvain. com/marketinfo/marketinfo. M. L..gennaio 2000 senza di software progettato specificamente per il loro trattamento e Note conclusive la loro analisi. Marco J. 179-207. Market Microstructure Theory. (1995).Massimiliano Cecconi. ACD Model: An Application to Market Microstructure and NASDAQ. Giot. (1999). si trovano già. [13] Zhang. [4] Engle. 1-22. CORE Discussion Paper 9789 : Universitè Catholique de Louvain. (1999). che tale modello è in grado di riprodurre in maniera adeguata l’andamento delle transazioni intragiornaliere. R. pp. M. anche la stessa riamente i principali problemi raccolta e analisi grafica dei dati è che si incontrano volendo la. R.A. 66. Cambridge: Cambridge University Press. (1979). Russell. Econometric Society Monographs. Lombardi . On a Measure of Lack of Fit in Time Series Models. la spinta decisiva alla sito. Princeton: Princeton University Press. Müller.. Time Series Analysis. Jasiak [8]) e la non-linearità (Log ACD. [10] Ljung. [12] TAQ Database. (1994). T. 1127-1162. London: Risk Books. in particolare il fatto che non quanto si è verificato in passato per risultano equispaziati. 2001 23 . G. A Ringraziamenti R ingraziamo la Borsa Italiana S. Gençay. Sutcliffe. M. San Diego: Academic Press. [13]). [3] Dacorogna. A tale propo. Oxford: Basil Blackwell Inc. A Nonlinear Autoregressive Conditional Duration Model with Applications to Financial Transaction Data. pp. D. [2] Bauwens.gli operatori del settore. pp. pp. (1998). [11] O’Hara. G. [7] Hamilton. Manuscript: York University. (1998).. 265-270. si è introdotto il modello ACD. F.. al di là dell’assenza di pacchetti di stibbiamo presentato somma. L. Y. 104. Si è osservato. Autoregressive Conditional Duration: A New Model for Irregularly Spaced Transaction Data.sui software di uso comune presso quenza al posto dei “tradizionali” da. J.9-10. O.. Un ringraziamento particolare va inoltre al Prof. (1990). con l’obiettivo di migliorarne la performance e di renderlo adeguato a tratFigura 8 Scatterplot tra quantili stimati e quantili teorici della tare determinate carattedistribuzione esponenziale per il titolo FIAT .V. Giot. numerose applicazioni.

Marco J. Ha discusso una tesi in Econometria dal titolo: “Modelli econometrici per fenomeni soggetti a smooth transition: lo studio della volatilità sui mercati finanziari”. M M FEDRA l gruppo di ricerca FEDRA (Financial Econometrics and Derivatives Research Associates) si è costituito nel giugno 2001 presso il Dipartimento di Statistica “G. Brownlees. Ulteriori informazioni sulle attuali attività del gruppo sono disponibili all’URL: http://www.Densità di Weibull per diversi valori del parametro k. ha ricevuto dalla commissione l’auspicio di pubblicazione.it o all'URL: http://www.9-10. Lavora presso il Dipartimento di Statistica “G. Orazio Di Miscia. dove svolge una ricerca dal titolo “Microstrutture di Mercati Finanziari”. Notizie sugli Autori MASSIMILIANO CECCONI assimiliano Cecconi si è laureato a pieni voti con lode presso la Facoltà di Economia dell’Università degli Studi di Firenze nell’aprile 2001. Oltre che ai modelli per dati ad alta frequenza e ai modelli a memoria lunga. ponendo θ = 1 per t > 0.it/~fedra/.it. Dopo il Diploma di Maturità Classica. ed ha tasso di guasto costante. Ai fini delle stime ACD. Parenti” dell’Università di Firenze.unifi. supervisionata dal Prof. Lombardi . Gallo. Giampiero M. Il parametro θ. Parenti” dell’Università degli studi di Firenze. I suoi interessi di ricerca riguardano l’econometria dei mercati finanziari. si è iscritto alla Facoltà di Economia dell’Università degli studi di Firenze e si è laureato col massimo dei voti e lode il 12 febbraio 2001. 2001 . Parenti” dell’Università degli studi di Firenze con l’obiettivo di coordinare e promuovere l’attività di ricerca del dipartimento nel settore dell’analisi quantitativa dei mercati finanziari.B.it/~mjl/. Lombardi e Barbara Pacini. Si interessa inoltre di modellistica GARCH per lo studio della volatilità. Morgagni 59 . con particolare attenzione alla microstruttura dei mercati ed allo studio delle serie storiche finanziarie ad altissima frequenza (tick-by-tick). rendendo così la distribuzione assai versatile. per la quale la commissione di laurea ha espresso l'auspicio di pubblicazione.ds. supervisionata dal prof.unifi. costante o decrescente. è detto parametro di scala. LOMBARDI arco Jacopo Lombardi è nato a Firenze il 16 giugno 1976. Il parametro k può assumere valori strettamente positivi e determina.50134 Firenze) e può essere contattato all’indirizzo e-mail: mjl@ds. all’analisi spettrale. Parenti” dell’Università degli studi di Firenze (Viale G. come dice il nome stesso. modelli non-lineari per i mercati finanziari.unifi. Giampiero M.Dati finanziari ad alta frequenza APPROFONDIMENTO: LA DISTRIBUZIONE DI WEIBULL L a distribuzione di Weibull è in genere utilizzata per modellare dati di durata ed ha la peculiarità che la sua hazard function (funzione tasso di guasto) dipende dal parametro di forma k e può risultare crescente. alle reti neurali e ai metodi numerici di ottimizzazione. MARCO J. Il gruppo è diretto da Giampiero M.unifi. il parametro di scala viene spesso fissato a priori pari a uno. n.ds.cecconim. Nel caso in cui k = 1 la distribuzione è detta anche esponenziale. Attualmente segue il corso di Dottorato di Ricerca in Statistica Applicata presso il Dipartimento di Statistica “G. Attualmente è Assegnista di Ricerca presso il Dipartimento di Statistica “G. Marco J. In Figura 10 riportiamo il grafico della densità di Weibull per tre diversi valori di k. metodi di simulazione. È contattabile all’indirizzo e-mail: cecconim@ds. è interessato alla programmazione in linguaggio C/C++. La sua tesi in Econometria. Anno III. Gallo ed è attualmente composto da Christian T. invece. Massimiliano Cecconi. implementazione di routine econometrico-finanziarie. Fa infine parte del gruppo di ricerca FEDRA.it o all’URL http://www. la forma della distribuzione.Massimiliano Cecconi. L’equazione della funzione di densità di probabilità è: Figura 10 . modelli a transizione liscia. e determina l’ampiezza della distribuzione. I 24 Scienza & Business. Andrea Gigli. Gallo e intitolata “La previsione della volatilità di attivi finanziari: Processi a memoria lunga e Fractionally Integrated GARCH”.