2024-01-23

Análisis de datos I (MAT1409)

Tema. 2.1.1 Objetivos de las MTC

  • Describen la tendencia de los datos a agruparse alrededor de un punto medio.

  • Intento de encontrar un solo valor para describir todas las cifras de una serie.

  • Buscar un valor para representar todos los valores de una población.

Tema. 2.1.1 Usos de las MTC:

  • Presentar una característica destacada en un conjunto de datos.

  • Facilitar la comparación.

  • Conocer la muestra.

  • Trazar relaciones matemáticas.

  • Ayudar en la toma de decisiones.

Tema. 2.1.2 Características de las MTC:

  • Definirse rígidamente.

  • Basarse en todas las observaciones.

  • Ser fácil de entender.

  • Ser fácil de calcular.

  • Ser menos afectado por los problemas de muestreo.

Tema. 2.1.3 Clasificación de las MTC:

2.2 Media Aritmética Simple

\[\overline{x} = \frac{1}{n} \sum_{i=i}^{n} x_{i} \]

Explícitamente:

\[\overline{x} = \frac{1}{n} (x_1 + x_2 + \dots + x_{n-1} + x_n) \]

  • El orden de los sumandos no altera la suma o total.

2.2 Media Aritmética Simple Ejemplo (1)

Supongamos que tenemos datos de 10 días de la temperatura máxima en Mérida durante enero:

\[\begin{align*} &[32.21, 27.21, 25.83, 28.13, 33.89, \\ &\quad 26.01, 26.11, 28.73, 28.72, 33.89] \end{align*}\]

¿Cuál es la media aritmética de los datos?

2.2 Media Aritmética Simple Ejemplo (1/2)

\[\overline{x} = \frac{1}{10} (32.21 + 27.21 + \dots + 28.72 + 33.89) \]

1/10*(32.21 + 27.21 + 25.83 + 28.13 
      + 33.89 + 26.01 + 26.11 + 
        28.73 + 28.72 + 33.89)
## [1] 29.073

2.3 Media Aritmética Ponderada

¿Cuándo se utiliza?

  • Cuando las observaciones tienen frecuencias.

  • Cuando las observaciones tienen intervalos.

  • Cuando las observaciones tienen probabilidad o proporción.

2.3 Media Aritmética Ponderada Ejemplo (1)

grupo frecuencia
20 - 29 31
30 - 39 15
40 - 49 14
50 - 59 3
60 - 69 42
70 - 79 51
80 - 89 43

2.3 Media Aritmética Ponderada Ejemplo (1/2)

Calcular el centro del intervalo:

  • Intervalo Par: \[ X_c = \frac{a + b}{2} \]

  • Intervalo Impar: \[ X_c = a + \frac{b - a}{2} \]

2.3 Media Aritmética Ponderada Ejemplo (1/3)

Intervalo Par:

  • \([a -b]\)

  • \([20-29]\)

(20 + 29)/2
## [1] 24.5

2.3 Media Aritmética Ponderada Ejemplo (1/4)

grupo frecuencia X_c
20 - 29 31 24.5
30 - 39 15 34.5
40 - 49 14 44.5
50 - 59 3 54.5
60 - 69 42 64.5
70 - 79 51 74.5
80 - 89 43 84.5

2.3 Media Aritmética Ponderada Ejemplo (1/5)

\[ \overline{x}_w = \frac{\sum_{i=1}^{n} w_i \cdot x_i}{\sum_{i=1}^{n} w_i} \]

Hay que multiplicar cada observación por su respectivo peso y sumar \[ \overline{x}_w = \frac{w_1 \cdot x_1 + w_2 \cdot x_2 + \dots + w_{n-1} \cdot x_{n-1} + w_n \cdot x_n }{w_1 + w_2 + \dots + w_{n-1} + w_n } \]

2.3 Media Aritmética Ponderada Ejemplo (1/6)

grupo frecuencia X_c producto_ponderado
20 - 29 31 24.5 759.5
30 - 39 15 34.5 517.5
40 - 49 14 44.5 623.0
50 - 59 3 54.5 163.5
60 - 69 42 64.5 2709.0
70 - 79 51 74.5 3799.5
80 - 89 43 84.5 3633.5

2.3 Media Aritmética Ponderada Ejemplo (1/6)

En la calculadora, suma del producto ponderado:

(759.5 + 517.5 + 623 
  + 163.5 + 2709 + 3799.5 + 3633.5)
## [1] 12205.5

Entre la suma de los pesos:

(31 + 15 + 14 + 3 + 42 + 51 + 43)
## [1] 199

2.3 Media Aritmética Ponderada Ejemplo (1/7)

La media ponderada:

12205.5/ 199
## [1] 61.33417

2.3 Limitaciones de la Media Aritmética

  • Es sensible a valores extremos.
(20 + 15 + 18 + 90)/4
## [1] 35.75
  • No representa a la población en casos de falta de representación de la muestra (sesgo).
    • Selección: Cuando la muestra no se elige de manera aleatoria.
    • Respuesta: Cuando las respuestas en una encuesta no reflejan con precisión las variables (verdaderas opiniones).
    • Medición: Cuando hay errores en la captura de los datos, o el indicador no refleja la variable a medir.

2.4 Media Geométrica Intuición

  • Un valor que no sea tan sensible a valores extremos.

  • Un valor que tome en cuenta todos los datos de la serie.

  • Por ejemplo: la multiplicación de toda la serie.

\[ ( x_1 \cdot x_2 \cdot \ldots \cdot x_n ) \]

  • Sin embargo, el producto anterior está otra escala. \[ ( x \cdot x \cdot \ldots \cdot x_n )=x^n \]

  • Para tomar en cuenta el tamaño de muestra, y regresar el valor a su escala original \[x=\sqrt[n]{x^n} \]

2.4 Media Geométrica

-\(n\)esima raiz: \[ \overline{x}_g = \sqrt[n]{\left( x_1 \cdot x_2 \cdot \ldots \cdot x_n \right)} \]

-Como una potencia del inverso del tamaño muestral: \[ \overline{x}_g = \left( x_1 \cdot x_2 \cdot \ldots \cdot x_n \right)^{\frac{1}{n}} \]

2.4 Media Geométrica

¿Por qué atenúa la presencia de valores extremos?

  • Recordemos que

\[ (x_1 \cdot x_2)^\frac{1}{n}=x_1^\frac{1}{n} \cdot x_2^\frac{1}{n} \]

\[\ln(x_1^\frac{1}{n} \cdot x_2^\frac{1}{n})= \frac{1}{n} \cdot (\ln(x_1)+\ln(x_2)) \]

\[\exp(\ln(x_1)) = x_1 \]

  • Para volver a la escala original \[x_1^\frac{1}{n} \cdot x_2^\frac{1}{n}=\exp(\frac{1}{n} \cdot(\ln(x_1)+\ln(x_2)) \]

2.4 Media Geométrica

  • Entonces, la Media Geométrica, se puede expresar como una suma de logaritmos:

\[ \overline{x}_g = \exp(\frac{1}{n} \cdot(\ln(x_1)+\ln(x_2) + \dots +\ln(x_{n-1}) +\ln(x_{n})) \]

¿Por qué es importante esto?

2.4 Media Geométrica

  • Los valores extremos van a tener menos peso en el cómputo de la media.

2.4 Media Geométrica Ventajas

Una mejor representación de la tendencia central:

  • Cuando hay valores extremos.
(20*15*18*90)^(1/4)
## [1] 26.40335
  • Cuando hay mucha dispersión.

  • Para calcular el promedio de tasas de crecimiento.

2.4 Media Geométrica Ejemplo (1)

  • Supongamos que queremos encontrar un valor que represente a una serie de datos.

  • Por ejemplo, la altura de los hombres en la escuela, tienes 10 datos.

\[\begin{align*} &[1.6, 1.75, 0.68, 1.42, 1.74, \\ &\quad 1.28, 1.78, 1.89, 1.6, 2.02] \end{align*}\]

2.4 Media Geométrica Ejemplo (1/2)

  • Resultado
## [1] 1.519171

2.4 Media Geométrica Limitaciones

  • No está definida para números negativos y cero.

2.4 Media Geométrica Ejemplo (2/1)

  • Calcula el promedio del crecimiento acumulado del PIB en México.

2.4 Media Geométrica Ejemplo (2/2)

Año PIB Año.1 PIB.1
2011 0.85 2016 1.97
2012 2.50 2017 -0.28
2013 2.70 2018 -8.65
2014 1.77 2019 5.84
2015 1.87 2020 3.90

2.4 Media Geométrica Ejemplo (2/2)

  • Paso 1: Expresar las tasas de crecimiento como decimal \((\frac{\%}{100})\).
  • Paso 2: Calcular los factores de crecimiento \((1 + \frac{\%}{100})\)
Año PIB F_PIB Año.1 PIB.1 F_PIB.1
2011 0.85 1.0085 2016 1.97 1.0197
2012 2.50 1.0250 2017 -0.28 0.9972
2013 2.70 1.0270 2018 -8.65 0.9135
2014 1.77 1.0177 2019 5.84 1.0584
2015 1.87 1.0187 2020 3.90 1.0390

2.4 Media Geométrica Ejemplo (2/3)

  • Paso 3: Calcular la media geométrica \(\overline{x}_g\).
  • Paso 4: Restar al resultado \(\overline{x}_g-1\) para estimar la tasa acumulada de crecimiento.
## [1] 0.01178093
## 
## Promedio Geométrico del PIB MX: 0.01

Revisión

Revisión

## Versión: 30/01/2024

Bibliografía

Bibliografía