name: xaringan-title class: inverse, left, bottom background-image: url(pictures/picuniform.jpg) background-size: cover # **Econometría II** ---- ## **<br/> ARIMA B** ### Carlos A. Yanes Guerra ### 2024-I --- class: inverse # Preguntas de las sesiones anteriores? --- # Recordeis -- 1. Es .hi[estacionario] o .hi-purple[no estacionario]? -- 2. Qué tipo de .hi[autocorrelación] manifiestan los patrones de la serie? -- 3. Posee una variación .hi-slate[estacional]? -- 4. Existe algún desplazamiento estructural? --- layout: true # Procesos MA --- -- <cy-blockquote> Los **MA(q)** son procesos que indican que la serie de tiempo depende de los errores pasados. Al igual que los AR(p), sirven para modelar y pronosticar desde el modelo univariado los periodos futuros </cy-blockquote> -- Algunas características de este proceso son: -- + Un MA(1) se representa como: `\(y_t=\mu+\epsilon_t+ \theta_1 \epsilon_{t-1}\)` + Un MA(2) se representa como: `\(y_t=\mu+\epsilon_t+ \theta_1 \epsilon_{t-1}+ \theta_2 \epsilon_{t-2}\)` + Un MA(q) se representa como: `\(y_t=\mu+\epsilon_t+ \theta_1 \epsilon_{t-1}+\cdots+\theta_q \epsilon_{t-q}\)` --- -- Existe en series de tiempo un *teorema* y es el que nos dice que cualquier serie que es .hi-purple[**estacionaria**] puede representarse mediante un .hi[MA(q)] de orden infinito. Esto lo dice Wold(1936). -- <img src="Clase05_files/figure-html/bo-1.svg" width="70%" style="display: block; margin: auto;" /> --- -- Determine si el Proceso MA es .hi[estacionario] en .hi-slate[media] y .hi-slate[varianza] -- `$$y_t=a+\theta_1 \epsilon_{t-1}+ \epsilon_t$$` -- `$$E[y_t]=E[a+\theta_1 \epsilon_{t-1}+ \epsilon_t]$$` -- `$$E[y_t]=a+\theta_1 \color{red}{E[\epsilon_{t-1}]}+ \color{blue}{E[\epsilon_t]}$$` -- Recordemos que por .hi[**ruido blanco**] eso es `\(\sim(0, \sigma^2)\)` -- `$$\boxed{E[y_t]=a}$$` -- No depende de `\((t)\)`. --- -- Vamos ahora con la .hi-slate[**varianza**]: -- `$$y_t=a+\theta_1 \epsilon_{t-1}+ \epsilon_t$$` -- `$$Var[y_t]=Var[a+\theta_1 \epsilon_{t-1}+ \epsilon_t]$$` -- `$$Var[y_t]=\theta_1^2 \color{red}{Var[\epsilon_{t-1}]}+ \color{blue}{Var[\epsilon_t]}$$` -- Recordemos nuevamente que por .hi[**ruido blanco**] eso es `\(\sim(0, \sigma^2)\)` -- `$$Var[y_t]=\theta_1^2\color{blue}{\sigma^2}+\color{blue}{\sigma^2}$$` -- `$$Var[y_t]=\color{blue}{\sigma^2}(\theta_1^2+1)$$` -- Tambien piense que la .hi[varianza] se escribe como `\(\gamma_0\)` -- `$$\boxed{\gamma_0=\color{blue}{\sigma^2}(\theta_1^2+1)}$$` --- -- El asunto de la .hi[covarianza] permite gráficar e identificar los procesos concernientes a la autocorrelación y por ende tener las funciones de autocorrelación .hi-slate[simple] y .hi-purple[parcial]. -- `$$cov[y_t, y_{t-s}]=\theta_{1}^2cov[\epsilon_{t-1}, \epsilon_{(t-s)-1}]+ cov[\epsilon_t, \epsilon_{t-s}]$$` -- `$$\gamma_0=\theta_1^2\color{blue}{\sigma^2}+\color{blue}{\sigma^2}$$` -- Entonces si `\(s=-1,1\Rightarrow \quad \gamma_1=\theta_1\sigma^2\)` -- Entonces si `\(s=2\Rightarrow \quad \gamma_2=0\)` -- Entonces si `\(s=3\Rightarrow \quad \gamma_3=0\)` -- Dicho mejor -- `$$\rho =\left\{\begin{matrix} 1& si \quad s=0 \\ \frac{\theta_1}{1+\theta_1^2}& si \quad s=1, -1 \\ 0 & \text{de otro lado} \end{matrix}\right.$$` --- -- <img src="Clase05_files/figure-html/unnamed-chunk-1-1.svg" width="70%" style="display: block; margin: auto;" /> --- --
Preguntemos algo: Intente identificar el orden del siguiente modelo -- <img src="Clase05_files/figure-html/unnamed-chunk-2-1.svg" width="70%" style="display: block; margin: auto;" /> --- -- <img src="Clase05_files/figure-html/unnamed-chunk-3-1.svg" width="70%" style="display: block; margin: auto;" /> --- -- - Identificar los modelos por sus respectivas `ACF` y `PACF` es mejor que estar haciendo 1000 modelos y encontrar el modelo con menor criterio AIC o BIC. -- - Dentro de los criterios, recordando nuevamente su formulación pero en términos de varianza: -- .hi-orange[Criterio de AKAIKE]: Es el menos estricto de todos, no es .hi[consistente] pero si eficiente. -- `$$AIC= ln (\sigma^{2})+ \dfrac{2k}{T}$$` -- .hi-orange[Criterio de BAYES]: Es el mejor, castiga (sobre parametrización), es consistente pero no muy eficiente (no robusto en residuos). -- `$$BIC= ln (\sigma^{2})+ \dfrac{k}{T}Ln(T)$$` -- Donde `\((\sigma^{2})\)` es la varianza de los errores (residuos del modelo), `\((k)\)` el número de parámetros (p+q+1) si se incluye la constante y de (p+q) si se omite y por último `\((T)\)` es el numero de observaciones. --- -- Ejercicio 1: -- Qué modelo es mejor? <table> <thead> <tr> <th style="text-align:left;"> # Lags </th> <th style="text-align:center;"> AIC </th> <th style="text-align:center;"> BIC </th> <th style="text-align:center;"> R2 </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;color: #272822 !important;line-height: 110%;font-style: italic;color: #272822 !important;"> 0 </td> <td style="text-align:center;color: #272822 !important;line-height: 110%;"> 1.095 </td> <td style="text-align:center;color: #272822 !important;line-height: 110%;"> 1.076 </td> <td style="text-align:center;color: #272822 !important;line-height: 110%;"> 0.000 </td> </tr> <tr> <td style="text-align:left;color: #272822 !important;line-height: 110%;font-style: italic;color: #272822 !important;"> 1 </td> <td style="text-align:center;color: #272822 !important;line-height: 110%;"> 1.067 </td> <td style="text-align:center;color: #272822 !important;line-height: 110%;"> 1.030 </td> <td style="text-align:center;color: #272822 !important;line-height: 110%;"> 0.056 </td> </tr> <tr> <td style="text-align:left;color: #272822 !important;line-height: 110%;font-style: italic;color: #272822 !important;"> 2 </td> <td style="text-align:center;color: #272822 !important;line-height: 110%;"> 0.955 </td> <td style="text-align:center;color: #272822 !important;line-height: 110%;"> 0.900 </td> <td style="text-align:center;color: #272822 !important;line-height: 110%;"> 0.181 </td> </tr> <tr> <td style="text-align:left;color: #272822 !important;line-height: 110%;font-style: italic;color: #272822 !important;"> 3 </td> <td style="text-align:center;color: #272822 !important;line-height: 110%;"> 0.957 </td> <td style="text-align:center;color: #272822 !important;line-height: 110%;"> 0.884 </td> <td style="text-align:center;color: #272822 !important;line-height: 110%;"> 0.203 </td> </tr> <tr> <td style="text-align:left;color: #272822 !important;line-height: 110%;font-style: italic;color: #272822 !important;"> 4 </td> <td style="text-align:center;color: #272822 !important;line-height: 110%;"> 0.986 </td> <td style="text-align:center;color: #272822 !important;line-height: 110%;"> 0.895 </td> <td style="text-align:center;color: #272822 !important;line-height: 110%;"> 0.204 </td> </tr> <tr> <td style="text-align:left;color: #272822 !important;line-height: 110%;font-style: italic;color: #272822 !important;"> 5 </td> <td style="text-align:center;color: #272822 !important;line-height: 110%;"> 1.016 </td> <td style="text-align:center;color: #272822 !important;line-height: 110%;"> 0.906 </td> <td style="text-align:center;color: #272822 !important;line-height: 110%;"> 0.204 </td> </tr> <tr> <td style="text-align:left;color: #272822 !important;line-height: 110%;font-style: italic;color: #272822 !important;"> 6 </td> <td style="text-align:center;color: #272822 !important;line-height: 110%;"> 1.046 </td> <td style="text-align:center;color: #272822 !important;line-height: 110%;"> 0.918 </td> <td style="text-align:center;color: #272822 !important;line-height: 110%;"> 0.205 </td> </tr> </tbody> </table> -- **R./** Note que depende que quiere ver el investigador. Si desea muchos rezagos lo mejor es tomar entonces el `\(\bar{R}^2_{adj}\)`. El BIC penaliza la sobreparametrización y el AIC es un poco mas intermedio. --- layout: false class: inverse, middle, center # Otras consideraciones de los Procesos MA 😛 --- # Invertibilidad -- > Un proceso MA es invertible si: -- Considere el modelo MA: -- `$$y_t-\mu=(1+\theta L)\epsilon_t$$` -- `$$E(\epsilon_t, \epsilon_{s})=\left\{\begin{matrix} \sigma^2& si \quad s=t \\ 0 & \text{de otro lado} \end{matrix}\right.$$` -- `$$Si \quad |\theta|<1$$` -- .pad-left[ `\((1+\theta L)^{-1}(y_t-\mu)=\epsilon_t\)` ] -- .pad-left[ `\((1-\theta L+\theta^2 L^2-\theta^3 L^3+\cdots)(y_t-\mu)=\epsilon_t\)` ] -- .pad-left[ Es .hi-green[Invertible AR(p)] .pink[✔] ] --- # Invertibilidad -- <cy-blockquote> Dentro de las condiciones de invertibilidad también debe tenerse en cuenta las **raíces complejas** y esto es `\(1+\theta_1 z+\theta_2 z^2+\cdots +\theta_q z^q z\)`, en un plano complejo deben caer por fuera del circulo unitario</cy-blockquote> -- Esto es condicionante de: -- - Para procesos de `\(q=1\)`: `\(-1<\theta_1 < 1\)` -- - Para procesos de `\(q=2\)`: `\(-1<\theta_2 < 1\)` pero `\(\theta_2+\theta_1> -1\)` o `\(\theta_1 - \theta_2 < 1\)` -- - Para procesos de `\(q=3\)` es mas complejo... pero los softwares responden por ello. --- class: inverse, middle, center # Con respecto a los modelos Diferenciados!! --- # Ejemplo -- .attn[Punto]: Suponga que le ha tocado hacer un modelo y pronostico para .hi[inflación]. El resultado de todo, término siendo: -- `$$\Delta Inf_{t}=-0.0145-.3215 \Delta inf_{t-1}$$` -- `\(Inf_{2021:3}=6.53\%\)` es la inflación del respectivo año 2021 en el mes 3. -- La inflación del siguiente periodo fué `\(Inf_{2021:4}=6.56\%\)`. Note que si diferenciamos tendremos -- `$$Inf_{2021:4}-Inf_{2021:3}=0.029$$` -- Reemplazamos ese valor en nuestro modelo original: -- `$$\Delta Inf_{t}=-0.0145-.3215 (\color{red}{0.029})=\color{purple}{-0.02382}$$` -- Lo que usando el último valor del mes: -- `$$Inf_{2021:3}+\Delta_{2021:4}\Rightarrow 6.56-0.02382=6.54\%$$` --- class: inverse, middle, center # Modelo SARIMA --- layout: true # Modelo Sarima --- -- | ARIMA | `\(~\underbrace{(p, d, q)}\)` | `\(\underbrace{(P, D, Q)_{m}}\)` | | ----: | :-----------------------: | :--------------------------: | | | `\({\uparrow}\)` | `\({\uparrow}\)` | | | Parte NO estacional | Parte estacional | | | del modelo | del modelo | Donde `\(m =\)` número de observaciones por año. -- Los modelos SARIMA, permiten no tener raices estacionales. Recuerde que no ser .hi[**estacionario**] tiene muchos problemas a la hora de pronosticar. --- -- La .hi[parte estacional] de un modelo AR o MA se verá en los rezagos estacionales de PACF y ACF. -- Un `\(ARIMA(0,0,0)(0,0,1)_{12}\)` mostrará: -- * Un pico en el lag 12 del ACF pero ningún otro pico significativo. * El PACF mostrará un decaimiento exponencial en los rezagos estacionales; es decir, en los rezagos `\(12, 24, 36, \dots\)`. -- Un `\(ARIMA(0,0,0)(1,0,0)_{12}\)` mostrará: -- * Decaimiento exponencial en los .hi-orange[rezagos estacionales] de la ACF * Un único pico significativo en el lag 12 en el PACF. --- layout: false # Bibliografía
Chatfield, C. (2000). *Time-series forecasting*. CRC press.
Hyndman, R.J., & Athanasopoulos, G. (2021). *Forecasting: principles and practice*, 3rd edition, OTexts: Melbourne, Australia.
Shumway, R., & Stoffer, D. (2019). *Time series: a data analysis approach using R*. CRC Press.
Campo, J. Notas de clase (MIMEO) --- name: adios class: middle .pull-left[ # **¡Gracias!** <br/> ## Modelos MA ### Seguimos aprendiendo ] .pull-right[ .right[ <img style="border-radius: 50%;" src="https://avatars.githubusercontent.com/u/39503983?v=4" width="150px" />
[Syllabus/ Curso](https://pomelo.uninorte.edu.co/pls/prod/bwckctlg.p_disp_course_detail?cat_term_in=202210&subj_code_in=ECO&crse_numb_in=0010)<br/>
[@keynes37](https://twitter.com/keynes37)<br/>
[ cayanes@uninorte.edu.co](mailto:cayanes@uninorte.edu.co) ] ]