Analisi tecnico-economica dei progetti ICT Analisi della domanda Maurizio Naldi Universit` a di Roma Tor Vergata
A.A. 2012-13
Analisi della domanda
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
2 / 96
Analisi della domanda di un servizio
Modelli econometrici Modelli di diffusione
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
3 / 96
Modelli econometrici Stimano la domanda in funzione di parametri socio economici (variabili esplicative) Esempi di variabili esplicative Prodotto interno lordo per persona Teledensity Et`a del capofamiglia Livello di istruzione del capofamiglia Composizione della famiglia (numerosit`a, et`a, . . . ) Possesso di apparecchi elettronici Collocazione geografica (zona urbana o rurale) Densit`a di adozione in ambito locale Prezzo (costi fissi, canone, e costi variabili, a traffico) Reddito Indici di mobilit`a M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
4 / 96
Descrizione della domanda di un servizio
A livello d’utente la diffusione di un servizio pu` o essere descritta da una variabile binaria Il valore Y = 1 indica l’adesione al servizio Il valore Y = 0 indica la non adesione al servizio
Il numero P di utenti `e dato dalla somma delle variabili indicatrici Nutenti = N i=1 Yi
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
5 / 96
Variabili binarie e regressione
Obiettivo generale: Descrivere una variabile dipendente limitata mediante regressione Obiettivo particolare: Descrivere una variabile dipendente binaria (adesione al servizio) mediante regressione Problemi: La gamma di valori ottenibile da una regressione non `e limitata La variabile indicatrice binaria `e una variabile aleatoria
Soluzione: Utilizzare il valore atteso della variabile indicatrice Impiegare una funzione di mappaggio dal risultato della regressione alla predizione del valore atteso
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
6 / 96
Modelli lineari per variabili dipendenti limitate
Il modello di regressione `e E[Y |x1 , x2 , . . . , xM ] = G (β0 + β1 x1 + . . . + βM xM ) La funzione di mappaggio `e G (z) : z ∈ (−∞, +∞) −→ G (z) ∈ (0, 1) La predizione del valore atteso `e anche una predizione di probabilit`a P[Y = 1] = E[Y ]
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
7 / 96
Il modello logit z
e La funzione di mappaggio `e G (z) = 1+e z , ovvero la funzione di distribuzione cumulativa logistica
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
8 / 96
Confronto tra distribuzione logistica e normale
Densit`a logistica (tratteggio) Densit`a normale (tratto solido)
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
9 / 96
Il modello probit
Rz 2 La funzione di mappaggio `e G (z) = −∞ √12π e −w /2 dw , ovvero la funzione di distribuzione cumulativa normale standard
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
10 / 96
Influenza dei fattori sulla probabilit`a di adesione
Approssimazione del differenziale =1] ∆xi = g (β0 + βx)βi ∆xi ∆P[Y = 1] ' ∂P[Y ∂xi Indichiamo per semplicit`a p = P[Y = 1]
LOGIT ∆p ' p(1 − p)βi ∆xi
M. Naldi (URM2)
∆p '
Corso ATEP
√1 2π
PROBIT (β +βx)2 0 exp − βi ∆xi 2
A.A. 2012-13
11 / 96
Influenza di variazioni di variabili binarie
Variabile x1 binaria con valori 0 e 1 Variazione della probabilit`a di adesione ∆p = G (β0 + β1 + β2 x2 + . . . + βM xM ) − G (β0 + β2 x2 + . . . + βM xM )
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
12 / 96
L’elasticit`a
Elasticit`a rispetto ad una variabile continua ∂p = xpi g (z)βi εxi = xpi ∂x i LOGIT
PROBIT
εxi = βi xi (1 − p)
M. Naldi (URM2)
εxi =
Corso ATEP
√1 2π
exp(−z 2 /2)βi xpi
A.A. 2012-13
13 / 96
La quasi-elasticit`a
Preferita perch`e la probabilit`a di adozione `e gi`a una variabile priva di unit`a di misura ∂p = g (z)βi xi εˆxi = xi ∂x i LOGIT
PROBIT
εˆxi = βi xi p(1 − p)
M. Naldi (URM2)
εˆxi =
Corso ATEP
√1 2π
exp(−z 2 /2)βi xi
A.A. 2012-13
14 / 96
Il modello di Cobb-Douglas
Serve per descrivere la relazione tra una variabile dipendente continua e divser variabili indipendenti anch’esse continue La relazione `e del tipo legge di potenza αM Y = α0 X1α1 · · · XM
E’ linearizzabile mediante una trasformazione logaritmica ln Y = ln α0 + α1 ln X1 + · · · + αM ln XM
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
15 / 96
L’elasticit`a nel modello di Cobb-Douglas
L’elasticit`a della grandezza di interesse rispetto ad una qualsiasi delle variabili esplicative `e sempre costante εX k =
M. Naldi (URM2)
Xk ∂Y Y ∂Xk
Corso ATEP
= αk
A.A. 2012-13
16 / 96
Stima dei parametri del modello di Cobb-Douglas
I parametri del modello possono essere ottenuti per regressione lineare multipla dopo aver operato una trasformazione logaritmica del modello I coefficienti della regressione sono le elasticit`a, ovvero gli esponenti delle variabili indipendenti
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
17 / 96
Stima della variazione della domanda
La variazione percentuale della domanda `e approssimativamente proporzionale alle variazioni percentuali delle variabili esplicative, secondo le rispettive elasticit`a ∆Y Y
M. Naldi (URM2)
∆XM 1 ' α1 ∆X X1 + · · · + αM XM
Corso ATEP
A.A. 2012-13
18 / 96
Il modello di Bass
Descrive la diffusione delle innovazioni (prodotti o servizi) Non usa variabili esplicative Costituisce un modello autoregressivo Descrive un fenomeno con saturazione
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
19 / 96
La curva delle adozioni
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
20 / 96
Il modello analitico
Il modello analitico descrive la probabilit`a d’acquisto al tempo t se il prodotto non `e stato acquistato precedentemente
0
F (t) 1−F (t)
= p + qF (t)
F (t) = Probabilit`a d’acquisto del prodotto nell’intervallo [0, t) p ≥ 0 = Coefficiente d’innovazione q ≥ 0 = Coefficiente d’imitazione
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
21 / 96
La soluzione del modello di Bass
La probabilit`a cumulativa d’acquisto si ottiene per integrazione dell’equazione differenziale
F (t) =
M. Naldi (URM2)
1−e −(p+q)t 1+ qp e −(p+q)t
Corso ATEP
A.A. 2012-13
22 / 96
Le vendite attese al tempo t
In un mercato potenziale di dimensione m il numero di vendite attese al tempo t `e
2
S(t) = m · f (t) = m (p+q) p
M. Naldi (URM2)
Corso ATEP
e −(p+q)t h
1+ qp e −(p+q)t
i2
A.A. 2012-13
23 / 96
Stima dei parametri del modello di Bass
La stima si effettua per regressione sul numero di vendite cumulative N(t) Dalla equazione differenziale del modello si ottiene f (t) = p + (q − p)F (t) − qF 2 (t) Il numero di vendite al tempo t `e q 2 S(t) = m · f (t) = mp + (q − p)N(t) − m N (t) = a + bN(t) + cN 2 (t)
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
24 / 96
Esempio di curve di Bass Valori alti per p indicano una diffusione iniziale veloce ma anche un rapido abbassamento del tasso di crescita Valori alti per q indicano una diffusione iniziale lenta ma in rapida crescita
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
25 / 96
Possibili curve di nuove adozioni
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
26 / 96
Tecniche di previsione
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
27 / 96
Contenuti
Quadro di impiego e classificazione Metodi qualitativi Serie storiche Metodi di regressione Metodi perequativi
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
28 / 96
Utilit`a delle previsioni
Aspetti ingegneristici Aspetti commerciali e di mercato Rapporti con l’esterno
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
29 / 96
Aspetti ingegneristici
Scelte architetturali: Collocazione e gerarchizzazione dei nodi Dimensionamento: Previsioni di traffico Instradamento: Previsione della matrice di traffico Affitto circuiti
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
30 / 96
Applicazioni commerciali
Segmentazione della clientela Segmentazione del territorio Schedulazione del lancio dei servizi Collocazione dei punti vendita e determinazione del loro numero Dimensionamento della forza vendita Stesura del budget e analisi di redditivit`a (cash flow, pricing)
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
31 / 96
Importanza delle previsioni per i rapporti con l’esterno
Rapporti con investitori: Posizionamento sul mercato e quotazione del titolo Rapporti con produttori: Co-gestione dei progetti di investimento e determinazione dei volumi di produzione
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
32 / 96
Quadro di impiego delle tecniche di previsione
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
33 / 96
Tecniche di previsione
Metodi qualitativi Metodo Delphi Focus Group
Approccio sperimentale Metodi quantitativi non sperimentali Regressione Tecniche perequative e autoregressive Sondaggio Conjoint Analysis
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
34 / 96
Il metodo Delphi
Per individuare gli scenari possibili relativi ai nuovi servizi si pu`o adottare il metodo Delphi: 1 2 3 4
Somministrazione di un questionario ad una selezione di esperti Analisi statistica delle risposte Invio dei risultati al gruppo di esperti Risomministrazione del questionario
Esempio: Progetto TITAN (Analisi tecnico-economica di reti d’accesso a larga banda) Questionario composto da 398 domande 100 esperti da 10 paesi (10 per Paese, 5 da operatore dominante)
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
35 / 96
Caratteristiche del metodo Delphi
Vantaggi Fornisce un consenso su uno scenario E’ utile per scenari con forte incertezza
Svantaggi Gli esperti possono essere polarizzati Pu` o essere costoso
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
36 / 96
Il Focus Group
La procedura `e uguale a quella del metodo Delphi, ma opera su persone normali (non esperti) Vantaggio: Considera gli utenti potenziali e non le opinioni degli addetti al mestiere Svantaggio: Gli utenti hanno una percezione vaga del futuro e dell’impatto di servizi innovativi
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
37 / 96
L’approccio sperimentale
Consiste nella variazione controllata delle variabili indipendenti durante la fornitura del servizio ad un gruppo di potenziali utenti Richiede la selezione preliminare di un gruppo di utenti
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
38 / 96
Fasi dell’approccio sperimentale
1
2
Selezione casuale dei partecipanti all’esperimento (campionamento stratificato) Suddivisione dei partecipanti in due gruppi Gruppo dell’esperimento (soggetti alle variazioni) Gruppo di controllo (non soggetti alle variazioni)
3
Effettuazione di un pre-test ad entrambi i gruppi, per verificarne l’omogeneit`a statistica e le condizioni di partenza
4
Fornitura del servizio ad entrambi i gruppi (Somministrazione dello stimolo) in condizioni diverse
5
Post-test per verificare le differenze nelle risposte dei due gruppi
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
39 / 96
Il sondaggio: Le fasi
1
Preparazione del questionario Inserimento di domande sull’intenzione di acquisto e sul livello di utilizzo Inserimento di domande su caratteristiche socio-demografiche e stili di vita
2
3
Selezione del campione (in maniera totalmente casuale o con campionamento stratificato) Svolgimento dell’intervista Posta elettronica Posta ordinaria Telefono Faccia a faccia
4
Elaborazione statistica delle risposte
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
40 / 96
Il sondaggio: caratteristiche
Il campione deve essere rappresentativo dei potenziali utenti Le risposte si riferiscono ad un solo istante temporale E’ costoso e richiede una preparazione accurata del questionario Il mezzo di intervista determina costi e percentuali di risposte
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
41 / 96
La conjoint analysis
Viene definita una gamma di servizi, con variazioni delle caratteristiche (una alla volta), incluso il prezzo Ai potenziali utenti viene richiesta una classificazione dei servizi in ordine di preferenza L’analisi dei risultati consente di valutare la sensibilit`a al prezzo ed il trade-off tra prezzo ed altre caratteristiche
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
42 / 96
La conjoint analysis: Pregi e difetti
Vantaggio: Si ottiene una risposta relativa al servizio nel suo complesso Svantaggi Richiede la costruzione di una gamma di servizi fittizi Il numero di alternative possibili (e quindi di confronti necessari) deve comunque essere limitato Il costo `e elevato perch´e richiede un approccio faccia a faccia
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
43 / 96
Le serie storiche
La serie storica `e una sequenza di valori di una grandezza di interesse osservati in un certo arco di tempo La grandezza di interesse viene in genere misurata ad intervalli regolari (campionamento equispaziato del fenomeno)
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
44 / 96
Esempi di serie storiche
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
45 / 96
Rappresentazione grafica di una serie storica
Rappresentazione cartesiana (valore vs. tempo) Rappresentazione cartesiana sovrapposta (Sequenza prima segmentata e poi rappresentazione cartesiana dei singoli segmenti) Rappresentazione polare (Modulo del vettore determinato dal valore della grandezze e fase del vettore determinato dal tempo), indicata per serie con componente ciclica
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
46 / 96
Esempi di rappresentazione grafica cartesiana
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
47 / 96
Esempi di rappresentazione grafica polare
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
48 / 96
Componenti di una serie storica
Trend o tendenza: componente media di lungo periodo (T) Componente ciclica: pu` o trattarsi di una componente il cui periodo `e legato al calendario oppure no; se `e legata al calendario (ma non necessariamente alle stagioni o a fenomeni meteo) si parla di componente stagionale (C) Componente accidentale: `e definita per differenza, ovvero `e ci`o che la componente di tendenza e quella ciclica non riescono a spiegare (E)
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
49 / 96
La composizione delle componenti
Modello additivo: la serie storica S `e il risultato della somma delle sue componenti S = T + C + E Modello moltiplicativo: la serie storica S `e il risultato del prodotto delle sue componenti S = T · C · E Considerando il logaritmo di un modello moltiplicativo si ottiene un modello additivo (se le componenti sono positive)
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
50 / 96
Primo esame della serie storica
Presenza di discontinuit`a Presenza di outlier Relazione tra fluttuazioni e livello della serie
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
51 / 96
Trasformazione logaritmica
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
52 / 96
Stima della tendenza
I metodi sono riconducibili a due categorie Metodi di regressione Metodi perequativi
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
53 / 96
Le curve di regressione
Viene assunto un modello costituito da una funzione del tempo di forma nota a cui si aggiunge una componente accidentale (aleatoria) yt = f (t) + Il problema consiste nell’adattare alla serie storica la curva di forma nota, stimandone i parametri Questi metodi vengono classificati secondo la forma della curva: Polinomiali Esponenziali Sigmoidi Esplicativi
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
54 / 96
Esempio di andamento dell’utenza radiomobile
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
55 / 96
Esempio di andamento dell’utenza a banda larga
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
56 / 96
La regressione per modelli polinomiali
L’andamento della tendenza `e supposto di tipo polinomiale f (t) = a0 + a1 t + · · · + ap t p Il grado `e tipicamente non superiore a 3 Il caso particolare di grado 1 coincide con la regressione lineare I coefficienti possono essere stimati mediante il metodo dei minimi quadrati
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
57 / 96
Determinazione dei coefficienti: La metrica
Supponiamo che la grandezza venga campionata ad istanti regolari t = 1, 2, . . . , n Disponiamo di n coppie (1, y1 ), (2, y2 ), . . . , (n, yn ) Definiamo P come metrica di qualit`a la somma degli scarti quadratici Q = nt=1 [yt − f (t)]2
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
58 / 96
Determinazione dei coefficienti: La soluzione
Troviamo i coefficienti che minimizzano la metrica ai :
∂Q ∂ai
=0
Per un polinomioPdi grado p otteniamo p + 1 equazioni in p + 1 n i incognite ∂Q t=1 −2t [yt − f (t)] = 0 ∂ai = Le equazioni risultanti vengono dette equazioni normali e sono lineari P nei parametri nt=1 t i [yt − (a0 + a1 t + · · · + ap t p )] = 0
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
59 / 96
Forma matriciale delle equazioni normali
P P n t . . . P tp P P t t2 . . . t p+1 .. .. .. .. . P p P .p+1 . P . 2p t t ... t
P yt P tyt = .. P .p t yt ap a0 a1 .. .
AX = B =⇒ X = A−1 B
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
60 / 96
La regressione esponenziale
La grandezza cresce (decresce) sempre con andamento esponenziale 1 2
f (t) = a exp(bt) f (t) = ab t
Il modello esponenziale pu` o essere ricondotto ad un modello lineare mediante trasformazione logaritmica 1 2
ln f (t) = ln a + bt ln f (t) = ln a + t ln b
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
61 / 96
I modelli sigmoidali
La curva ha un andamento monotono fino ad un valore asintotico Pu`o modellare sia fenomeni di crescita che di decrescita La forma della curva `e ad S allungata Modelli principali Logistico Gompertz
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
62 / 96
Definizione del modello logistico
Il modello logistico `e definito mediante il suo tasso di crescita rl = dy dt = ky (a − y ) Il tasso di crescita `e sempre positivo ma prima cresce e poi decresce Il massimo del tasso di picco si ha in y = a/2 e vale ka/4 Il valore asintotico della grandezza `e a
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
63 / 96
Esempio di andamento del tasso di crescita Valori dei parametri k = 2 e a = 1
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
64 / 96
Forma esplicita del modello logistico
Si ottiene dall’espressione del tasso di crescita risolvendo l’equazione differenziale col metodo della separazione delle variabili 1/a 1/a dy 1 Separazione = kdt =⇒ + y a−y dy = kdt y (a−y ) 2
Integrazione R y (t) 1/a y + y (0)
1/a a−y
dy =
Rt 0
kdx =⇒ y (t) =
a a 1+ y (0) −1 exp(−kat)
I parametri del modello si possono ottenere per regressione non lineare
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
65 / 96
Esempio di curva logistica Valori dei parametri k = 2, a = 1 e y (0) = 0.1
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
66 / 96
Definizione del modello di Gompertz
Il modello logistico `e definito mediante il suo tasso di crescita rG = dy dt = ky (ln a − ln y ) Il tasso di crescita `e sempre positivo ma prima cresce e poi decresce Il massimo del tasso di picco si ha in y = a/e e vale ka/e Il valore asintotico della grandezza `e a
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
67 / 96
Esempio di andamento del tasso di crescita per il modello di Gompertz Valori dei parametri k = 2 e a = 1
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
68 / 96
Forma esplicita del modello di Gompertz
Si ottiene dall’espressione del tasso di crescita introducendo una variabile ausiliaria u = ln y −→ dy = exp(u)du du ln a−u
= kdt
1
Separazione
2
Integrazione R u(t) du Rt a = exp(−kt) kdx =⇒ y (t) = a exp − ln 0 y (0) u(0) ln a−u
I parametri del modello si possono ottenere per regressione non lineare
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
69 / 96
Esempio di curva Gompertz Valori dei parametri k = 2, a = 1 e y (0) = 0.1
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
70 / 96
Metodi perequativi
Si basano sul filtraggio della serie storica, smussandone le componenti stagionali ed accidentali Utilizzano gli ultimi dati osservati Applicano un filtro tipicamente lineare ai dati della serie storica per ricavare la stima della tendenza
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
71 / 96
La media mobile
Il metodo perequativo pi` u semplice `e la media mobile E’ la media (aritmetica) degli ultimi valori osservati La finestra di osservazione si sposta nel tempo
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
72 / 96
La media mobile simmetrica semplice
La serie osservata `e costituita da 2m + 1 valori: x−m , x−m+1 , x−1 , x0 , x1 , . . . , xm La stima della tendenza per il tempo 0 `e xˆ0 =
1 2m+1
Pm
i=−m xi
Richiede dati successivi al tempo per il quale si stima la tendenza
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
73 / 96
La media mobile asimmetrica semplice
La stima `e ottenuta utilizzando solamente i valori passati La stima della tendenza `e ottenuta come media aritmetica degli ultimi m valori P La stima per il tempo t `e xˆt = m i=1 xt−i L’et`a media utilizzati per la stima `e P S dei1dati m(m+1) S = m1 m i = i=1 m 2 Una memoria lunga rende pi` u lento l’adeguamento a nuovi livelli
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
74 / 96
Campo di utilizzo della media mobile asimmetrica
La media mobile asimmetrica semplice `e adatta per stimare la tendenza di serie storiche con tendenza costante o lentamente variabile Il modello della serie storica corrispondente `e X (t) = α + t La componente aleatoria t si suppone con valore atteso nullo e varianza σ 2 costante La serie storica ha momenti E[X (t)] = α V[X (t)] = σ 2
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
75 / 96
Statistiche della previsione
La previsione per l’istante t `e una somma di m variabiliP aleatorie ˆt−1 (t) = 1 m X (t − i) indipendenti ed identicamente distribuite X i=1 m La previsione `e quindi una media campionaria Il valore atteso della P previsione `e ˆt−1 (t)] = 1 m E[X (t − i)] = E[X i=1 m
1 m mα
La varianza della P previsione `e ˆt−1 (t)] = 12 m V[X (t − i)] = V[X m
M. Naldi (URM2)
i=1
Corso ATEP
=α
1 mσ 2 m2
=
σ2 m
A.A. 2012-13
76 / 96
L’errore quadratico medio di previsione
2 ˆ E’ definito come R = E X (t) − Xt−1 (t) h i h i ˆ 2 (t) − 2E X (t)X ˆt−1 (t) = Il suo valore `e R = E X 2 (t) + E X t−1 2 α2 + σ 2 + α2 + σm − 2α2 = σ 2 1 + m1
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
77 / 96
Distribuzione dell’errore di previsione
La componente aleatoria si suppone con distribuzione normale Anche la serie storica e la previsione hanno distribuzione normale L’errore di previsione h i ha distribuzione normale con media nulla ˆ E X (t) − Xt−1 (t) = 0 h i ˆt−1 (t) = σ 2 1 + 1 V X (t) − X m
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
78 / 96
Intervalli di confidenza della previsione Varianza nota
Utilizziamo i percentili z della distribuzione gaussiana standard Effettuiamo una stima per intervalli di tipo bilatero Consideriamo un livello di confidenza α Il valorendella grandezza al tempo t `eo p ˆt−1 (t) ± zα/2 σ 1 + 1/m con probabilit`a 1 − α X (t) ∈ X
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
79 / 96
Intervallo di confidenza monolatero
Interessa tipicamente il limite superiore Il valore della grandezza al ptempo t `e ˆ X (t) < Xt−1 (t) + z1−α σ 1 + 1/m
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
80 / 96
Intervalli di confidenza della previsione Varianza incognita
La varianza incognita pu` o essere stimata come varianza campionaria h i2 P m 1 ˆt−1 (t) corretta σ ˆ 2 = m−1 X (t) − X i=1 Gli intervalli di confidenza si ottengono utilizzando i percentili della distribuzione t di Student con m − 1 gradi di libert`a L’intervallo n di confidenza bilatero o p `e ˆt−1 (t) ± tα/2,m−1 σ 1 + 1/m X (t) ∈ X L’intervallo di confidenza monolatero `e p ˆ X (t) < Xt−1 (t) + t1−α,m−1 σ 1 + 1/m
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
81 / 96
Exponential Smoothing semplice Valore atteso della previsione
Si considera il modello con tendenza costante X (t) = α + t E’ uno stimatore P non polarizzato ˆt−1 (t)] = t 1−ωt ω i−1 E[X (t − i)] = E[X i=1 1−ω
M. Naldi (URM2)
Corso ATEP
1−ω Pt i−1 i=1 ω 1−ω t α
=α
A.A. 2012-13
82 / 96
Exponential Smoothing semplice Varianza della previsione
P 1−ω 2 2(i−1) ˆt−1 (t)] = t V[X ω V[X (t − i)] = i=1 1−ω t 2 P t−1 2j 1−ω 2 1−ω σ 2 1−ω t j=0 ω ' σ 1+ω
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
83 / 96
Exponential Smoothing semplice Memoria equivalente
Lo stimatore ES ha una memoria teoricamente infinita I dati pi` u vecchi hanno un peso trascurabile La memoria equivalente corrisponde al numero di dati di una media mobile aritmetica con uguale varianza della previsione σ 2 1−ω 1+ω =
M. Naldi (URM2)
σ2 meq
=⇒ meq =
Corso ATEP
1+ω 1−ω
A.A. 2012-13
84 / 96
Exponential Smoothing semplice Parametro di smoothing e memoria
L’et`a media dei dati `e S = M. Naldi (URM2)
1+meq 2
Corso ATEP
=
1 ω
A.A. 2012-13
85 / 96
Exponential Smoothing semplice Distribuzione dell’errore di previsione
La componente aleatoria si suppone con distribuzione normale Anche la serie storica e la previsione hanno distribuzione normale L’errore di previsione h i ha distribuzione normale con media nulla ˆ E X (t) − Xt−1 (t) = 0 h i ˆt−1 (t) = σ 2 2 V X (t) − X 1+ω
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
86 / 96
Exponential Smoothing semplice Intervalli di confidenza della previsione per varianza nota
Utilizziamo i percentili z della distribuzione gaussiana standard Effettuiamo una stima per intervalli di tipo bilatero Consideriamo un livello di confidenza α Il valorendella grandezza alqtempo o t `e 2 ˆt−1 (t) ± zα/2 σ X (t) ∈ X con probabilit`a 1 − α 1+ω
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
87 / 96
Exponential Smoothing semplice Intervallo di confidenza monolatero
Interessa tipicamente il limite superiore ˆt−1 (t) + z1−α σ Il valore della grandezza al tempo t `e X (t) < X
M. Naldi (URM2)
Corso ATEP
q
A.A. 2012-13
2 1+ω
88 / 96
Exponential Smoothing Doppio
Consideriamo un andamento localmente lineare Il modello della serie `e X (t + h) = at + bt h + t Applichiamo un doppio smussamento 1 2
Alla serie storica Alla serie smussata (previsione del trend)
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
89 / 96
Exponential Smoothing Doppio Formule di aggiornamento
Indichiamo la serie storica semplicemente smussata come S1 (t) Applichiamo la doppia smussatura 1 2
S1 (t) = (1 − ω)X (t − 1) + ωS1 (t − 1) ˆt−1 (t) = (1 − ω)S1 (t) + ω Xt−2 ˆ (t − 1) S2 (t) = X
La relazione con i coefficienti del modello lineare `e 1 2
ˆat = 2S1 (t) − S2 (t) bˆt = 1−ω ω [S1 (t) − S2 (t)]
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
90 / 96
Exponential Smoothing Doppio Confronto con Exponential Smoothing Semplice
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
91 / 96
Previsione per istanti successivi
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
92 / 96
Il metodo di Holt-Winters
Assume un modello con tendenza lineare Il modello della serie `e X (t + h) = at + bt h + t ˆt (t + 1) = ˆat + bˆt La previsione ad un passo `e X
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
93 / 96
Il metodo di Holt-Winters Stima del livello e della pendenza
Si usa una stima con media pesata come nel metodo di Exponential Smoothing La stima del livello `e ˆat = αX (t) + (1 − α)(ˆat−1 + bˆt−1 ) La stima della pendenza `e bˆt = β(ˆat − ˆat−1 ) + (1 − β)bˆt − 1 Le stime possono essere inizializzate come ˆa2 = X (2) e bˆ2 = X (2) − X (1)
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
94 / 96
Scelta dei coefficienti
I coefficienti α e β sono entrambi positivi e minori di 1 Valori molti piccoli conducono a smussamento elevato Possono essere scelti minimizzando l’errore quadratico medio sulla serie storica osservata
M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
95 / 96
Il metodo di Holt-Winters Esempio
I coefficienti usati sono α = 0.234 e β = 0.045 M. Naldi (URM2)
Corso ATEP
A.A. 2012-13
96 / 96