Model Lagged Distributed Autoregressive (ADR), z języka angielskiego Model autoregresywnych rozproszonych opóźnień(ADL) to regresja, która obejmuje nową opóźnioną zmienną niezależną oprócz opóźnionej zmiennej zależnej.
Innymi słowy, model ADR jest rozszerzeniem modelu autoregresyjnego p-order AR(p), który obejmuje kolejną zmienną niezależną w okresie poprzedzającym okres zmiennej zależnej.
Przykład
Na podstawie danych z lat 1995-2018 obliczamy logarytmy naturalnekarnety narciarskie dla każdego roku i cofamy się o jeden okres dla zmiennychkarnety narciarskiet i utworówt:
Rok | Karnety narciarskie (€) | In_t | ln_t-1 | Utwory_t | Utwory_t-1 | Rok | Karnety narciarskie (€) | In_t | ln_t-1 | Utwory_t | Utwory_t-1 |
1995 | 32 | 3,4657 | 8 | 2007 | 88 | 4,4773 | 4,3820 | 6 | 9 | ||
1996 | 44 | 3,7842 | 3,4657 | 6 | 8 | 2008 | 40 | 3,6889 | 4,4773 | 5 | 6 |
1997 | 50 | 3,9120 | 3,7842 | 6 | 6 | 2009 | 68 | 4,2195 | 3,6889 | 6 | 5 |
1998 | 55 | 4,0073 | 3,9120 | 5 | 6 | 2010 | 63 | 4,1431 | 4,2195 | 10 | 6 |
1999 | 40 | 3,6889 | 4,0073 | 5 | 5 | 2011 | 69 | 4,2341 | 4,1431 | 6 | 10 |
2000 | 32 | 3,4657 | 3,6889 | 5 | 5 | 2012 | 72 | 4,2767 | 4,2341 | 8 | 6 |
2001 | 34 | 3,5264 | 3,4657 | 8 | 5 | 2013 | 75 | 4,3175 | 4,2767 | 8 | 8 |
2002 | 60 | 4,0943 | 3,5264 | 5 | 8 | 2014 | 71 | 4,2627 | 4,3175 | 5 | 8 |
2003 | 63 | 4,1431 | 4,0943 | 6 | 5 | 2015 | 73 | 4,2905 | 4,2627 | 9 | 5 |
2004 | 64 | 4,1589 | 4,1431 | 6 | 6 | 2016 | 63 | 4,1431 | 4,2905 | 10 | 9 |
2005 | 78 | 4,3567 | 4,1589 | 5 | 6 | 2017 | 67 | 4,2047 | 4,1431 | 8 | 10 |
2006 | 80 | 4,3820 | 4,3567 | 9 | 5 | 2018 | 68 | 4,2195 | 4,2047 | 6 | 8 |
2019 | ? | ? | 4,2195 | 6 |
Do wykonania regresji używamy wartości In_t jako zmienna zależna i wartościln_t-1 Taktory_t-1 jako zmienne niezależne. Wartości na czerwono są poza regresją.
Otrzymujemy współczynniki regresji:
W tym przypadku znak regresorów jest dodatni:
- Wzrost o 1€ w ceniekarnety narciarskie w poprzednim sezonie (t-1) przesunął się o 0,48€w ceniekarnety narciarskie na ten sezon (t).
- Wzrost czarnego pasa startowego otwartego w poprzednim sezonie (t-1) przekłada się na wzrost o 4,1% cenykarnety narciarskie na ten sezon (t).
Wartości w nawiasach pod współczynnikami są standardowymi błędami szacunków.
Zastępujemy
Następnie,
Rok | Karnety narciarskie (€) | Utwory | Rok | Karnety narciarskie (€) | Utwory |
1995 | 32 | 8 | 2007 | 88 | 6 |
1996 | 44 | 6 | 2008 | 40 | 5 |
1997 | 50 | 6 | 2009 | 68 | 6 |
1998 | 55 | 5 | 2010 | 63 | 10 |
1999 | 40 | 5 | 2011 | 69 | 6 |
2000 | 32 | 5 | 2012 | 72 | 8 |
2001 | 34 | 8 | 2013 | 75 | 8 |
2002 | 60 | 5 | 2014 | 71 | 5 |
2003 | 63 | 6 | 2015 | 73 | 9 |
2004 | 64 | 6 | 2016 | 63 | 10 |
2005 | 78 | 5 | 2017 | 67 | 8 |
2006 | 80 | 9 | 2018 | 68 | 6 |
2019 | 63 |
ADR (p, q) vs. AR (p)
Który model najlepiej nadaje się do przewidywania cenkarnety narciarskie biorąc pod uwagę powyższe obserwacje, AR (1) czy ADR (1,1)? Innymi słowy, czy włączasz zmienną niezależną?utworyt-1 w regresji pomaga lepiej dopasować naszą prognozę?
Patrzymy na R kwadrat regresji modeli:
Model AR (1): R2= 0,33
Wzór ADR (1,1): R2= 0,40
R2 modelu ADR (1,1) jest wyższy niż R2 modelu AR (1). Oznacza to, że wpisanie zmiennej niezależnejutworyt-1 w regresji pomaga lepiej dopasować nasze przewidywania.