2024-04-08

Ejemplo (2/1)

Contexto:

En un estudio de rendimiento académico en tres diferentes métodos de estudio (A, B, C) para estudiantes de secundaria, se busca determinar si existe una diferencia significativa en los puntajes obtenidos en un examen final. Los estudiantes fueron asignados aleatoriamente a uno de los tres métodos y se registraron sus puntajes al final del período de estudio.

Ejemplo (2/1)

Method A B C
58 58 48
64 69 57
55 71 59
66 64 47
67 68 49

Hipótesis de la ANOVA unidireccional.

Hipótesis

\[ H_0: \mu_1 = \mu_2 = \mu_3\\ H_A: \text{Al menos un grupo es diferente.}\\ \]

\(\mu_j\): Es la media de la población (grupo) \(j\).

ANOVA unidireccional, Notación.

Notación:

\[ x_{ij}: \text{valor de observación } i \text{ para tratamiento } j \\ n_j : \text{número de observaciones para el tratamiento } j \\ \bar{x}_j : \text{media de muestra para el tratamiento } j \\ s^2_j: \text{varianza de muestra para el tratamiento } j \\ s_j: \text{desviación estándar de muestra para el tratamiento } j \\ k: \text{Es el número de grupos.} \\ n_T: \text{Es el número total de datos.} \]

Tabla de ANOVA:

Fuente de Variación Suma de Cuadrados Grados de Libertad Cuadrado Medio Valor F Valor p
Tratamientos SCT \(k - 1\) \(CMT\) \(F\) \(p\)
Error SCE \(n_T - k\) \(MSE\)
Total ST \(n_T - 1\)

ANOVA unidireccional, media y varianza muestral.

  • Formulas de la media y la varianza de la muestra para cada grupo \(j\)

\[ \bar{x}_j = \frac{1}{n_j} \sum_{i=1}^{n_j} x_{ij} \]

\[ s^2_j = \frac{1}{n_j - 1} \sum_{i=1}^{n_j} (x_{ij} - \bar{x}_j)^2 \]

  • La media muestral general \[ \bar{\bar{x}} = \frac{1}{k} \sum_{j=1}^{k} \bar{x}_j \]

ANOVA unidireccional: varianza poblacional entre tratamientos.

  • El primer estimador de la varianza \(\sigma^2\) (entre grupos), se llama Cuadrado Medio de los tratamientos \[ CMT = \frac{1}{k - 1} \sum_{j=1}^{k} n_j (\bar{x}_j - \bar{\bar{x}})^2 \]

  • El numerador de llama Suma de cuadrados de los tratamientos \[ SCT = \sum_{j=1}^{k} n_j (\bar{x}_j - \bar{\bar{x}})^2 \]

ANOVA unidireccional: varianza poblacional entre tratamientos.

  • El segundo estimador de la varianza \(\sigma^2\) (dentro de los grupos), se llama Cuadrado medio debido al error (MSE en inglés).

\[ MSE_{\text{error}} = \frac{1}{n_T - k} \sum_{j=1}^{k} (n_j - 1) s^2_j \] - El numerados se llama Suma de cuadrados debido al error \[ SCE_{\text{error}} = \sum_{j=1}^{k} (n_j - 1) s^2_j \]

  • El denominador son los grados de libertad \(n_T - k\):

ANOVA unidireccional: F-Statistic

La estadística de prueba para la igualdad de \(k\) medias poblacionales es:

\[ F = \frac{CMT}{MSE} \]

La estadística de prueba sigue una distribución F con \(k - 1\) grados de libertad en el numerador y \(n_T - k\) grados de libertad en el denominador.

ANOVA unidireccional: Regla de Rechazo.

REGLA DE RECHAZO

Donde el valor de \(F_\alpha\) se basa en una distribución F con \(k - 1\) grados de libertad en el numerador y \(n_T - k\) grados de libertad en el denominador.

Enfoque del valor p:

Rechazar \(H_0\) si el valor \(p\) es \(< \alpha\).

Enfoque del valor crítico:

Rechazar \(H_0\) si \(F > F_\alpha\).

\(\alpha\) es el nivel de significania de la prueba.

Ejemplo (5/1)

  • Hacer el cómputo de la media y la varianza de la muestra para cada grupo \(j\).

  • Hacer el cómputo de la media general de la muestra.

COMENZAR A SUBSTITUIR

Ejemplo (6/1)

  • Media grupo A
(58 + 64+ 55 + 66 + 67)/5
## [1] 62
  • Media grupo B
(58 + 69 +  71 +  64 +  68)/5
## [1] 66
  • Media grupo C
(48 +  57 +  59 +  47 +  49)/5
## [1] 52

Ejemplo (7/1)

  • La media general de la muestra
(62 + 66 +52)/3
## [1] 60

Ejemplo (8/1)

  • Hacer el cómputo de la Suma de cuadrados de los tratamientos \(SCT\).

  • Hacer el cómputo de del Cuadrado Medio de los tratamientos \(CMT\)

Ejemplo (9/1)

  • La \(SCT\):
5*(62 - 60)^2 + 5*(66 - 60)^2 + 5*(52 - 60)^2
## [1] 520
  • El \(CMT\), dónde \(k=3\)
520/(3-1)
## [1] 260

Ejemplo (10/1)

  • Hacer el cómputo de la varianza muestral para cada grupo \(j\).

  • Hacer el cómputo de la Suma de cuadrados debido al error \(SCE_{\text{error}}\).

  • Hacer el cómputo del Cuadrado medio debido al error (\(MSE\) en inglés).

Ejemplo (11/1)

  • Varianza del grupo A (\(s^2_1\)):
((58 - 62) ^ 2 + (64 - 62) ^ 2 + (55 - 62) ^ 2 
 + (66 - 62) ^ 2 + (67 - 62) ^2)/(5-1)
## [1] 27.5
  • Varianza del grupo B (\(s^2_2\)):
((58 - 66) ^ 2 + (69 - 66) ^ 2 + (71 - 66) ^ 2 
 + (64 - 66) ^ 2 + (68 - 66) ^2)/(5-1)
## [1] 26.5

Ejemplo (12/1)

  • Varianza del grupo C (\(s^2_3\)):
((48 - 52) ^ 2 + (57 - 52) ^ 2 + (59 - 52) ^ 2 
 + (47 - 52) ^ 2 + (49 - 52) ^2)/(5-1)
## [1] 31
  • El \(SCE_{\text{error}}\).
(5-1)*27.5 + (5-1)*26.5 + (5-1)*31
## [1] 340
  • El \(MSE\).
340/(15-3)
## [1] 28.33333

Ejemplo (13/1)

El F-Statistic:

\[ F = \frac{CMT}{MSE} \]

260/28.33333
## [1] 9.176472

Los grados de libertad del numerador son \(k - 1 = 3 - 1 = 2\) y los grados de libertad del denominador son \(n_T - k = 15 - 3 = 12\).

Ejemplo (13/1)

La tabla completa:

Fuente de Variación Suma de Cuadrados Grados de Libertad Cuadrado Medio Valor F Valor p
Tratamientos 520 2 260 9.18 \(p\)
Error 340 12 28.333
Total 860 14

Ejemplo (14/1)

  • Encontrar los valores críticos para \(F(df_1=2, df_2=12)\).
  • En R, para 90% de nivel de confianza
qf(1 - .10, 2, 12)
## [1] 2.806796
  • En R, para 95% de nivel de confianza
qf(1 - .05, 2, 12)
## [1] 3.885294
  • En R, para 99% de nivel de confianza
qf(1 - .01, 2, 12)
## [1] 6.926608

Ejemplo (15/1)

  • En EXCEL, para 99% de nivel de confianza:
=DISTR.F.INV(.01,2,12)

CONCLUSIÓN

Se rechaza \(H_0\), debido a \(F(df_1=2, df_2=12)=6.92< 9.18\)

Revisión

## Versión: 09/04/2024

Bibliografía

Bibliografía

  • Smith, G. (2015). Essential statistics, regression, and econometrics.

  • Stock, J. H., & Watson, M. W. (2020). Introduction to econometrics. Pearson.

  • Anderson, Sweeney & Williams, (2010). Statistics for Business and Economics.