2024-01-23
Describen la tendencia de los datos a agruparse alrededor de un punto medio.
Intento de encontrar un solo valor para describir todas las cifras de una serie.
Buscar un valor para representar todos los valores de una población.
Presentar una característica destacada en un conjunto de datos.
Facilitar la comparación.
Conocer la muestra.
Trazar relaciones matemáticas.
Ayudar en la toma de decisiones.
Definirse rígidamente.
Basarse en todas las observaciones.
Ser fácil de entender.
Ser fácil de calcular.
Ser menos afectado por los problemas de muestreo.
\[\overline{x} = \frac{1}{n} \sum_{i=i}^{n} x_{i} \]
Explícitamente:
\[\overline{x} = \frac{1}{n} (x_1 + x_2 + \dots + x_{n-1} + x_n) \]
Supongamos que tenemos datos de 10 días de la temperatura máxima en Mérida durante enero:
\[\begin{align*} &[32.21, 27.21, 25.83, 28.13, 33.89, \\ &\quad 26.01, 26.11, 28.73, 28.72, 33.89] \end{align*}\]
¿Cuál es la media aritmética de los datos?
\[\overline{x} = \frac{1}{10} (32.21 + 27.21 + \dots + 28.72 + 33.89) \]
1/10*(32.21 + 27.21 + 25.83 + 28.13 + 33.89 + 26.01 + 26.11 + 28.73 + 28.72 + 33.89)
## [1] 29.073
¿Cuándo se utiliza?
Cuando las observaciones tienen frecuencias.
Cuando las observaciones tienen intervalos.
Cuando las observaciones tienen probabilidad o proporción.
grupo | frecuencia |
---|---|
20 - 29 | 31 |
30 - 39 | 15 |
40 - 49 | 14 |
50 - 59 | 3 |
60 - 69 | 42 |
70 - 79 | 51 |
80 - 89 | 43 |
Calcular el centro del intervalo:
Intervalo Par: \[ X_c = \frac{a + b}{2} \]
Intervalo Impar: \[ X_c = a + \frac{b - a}{2} \]
Intervalo Par:
\([a -b]\)
\([20-29]\)
(20 + 29)/2
## [1] 24.5
grupo | frecuencia | X_c |
---|---|---|
20 - 29 | 31 | 24.5 |
30 - 39 | 15 | 34.5 |
40 - 49 | 14 | 44.5 |
50 - 59 | 3 | 54.5 |
60 - 69 | 42 | 64.5 |
70 - 79 | 51 | 74.5 |
80 - 89 | 43 | 84.5 |
\[ \overline{x}_w = \frac{\sum_{i=1}^{n} w_i \cdot x_i}{\sum_{i=1}^{n} w_i} \]
Hay que multiplicar cada observación por su respectivo peso y sumar \[ \overline{x}_w = \frac{w_1 \cdot x_1 + w_2 \cdot x_2 + \dots + w_{n-1} \cdot x_{n-1} + w_n \cdot x_n }{w_1 + w_2 + \dots + w_{n-1} + w_n } \]
grupo | frecuencia | X_c | producto_ponderado |
---|---|---|---|
20 - 29 | 31 | 24.5 | 759.5 |
30 - 39 | 15 | 34.5 | 517.5 |
40 - 49 | 14 | 44.5 | 623.0 |
50 - 59 | 3 | 54.5 | 163.5 |
60 - 69 | 42 | 64.5 | 2709.0 |
70 - 79 | 51 | 74.5 | 3799.5 |
80 - 89 | 43 | 84.5 | 3633.5 |
En la calculadora, suma del producto ponderado:
(759.5 + 517.5 + 623 + 163.5 + 2709 + 3799.5 + 3633.5)
## [1] 12205.5
Entre la suma de los pesos:
(31 + 15 + 14 + 3 + 42 + 51 + 43)
## [1] 199
La media ponderada:
12205.5/ 199
## [1] 61.33417
(20 + 15 + 18 + 90)/4
## [1] 35.75
Un valor que no sea tan sensible a valores extremos.
Un valor que tome en cuenta todos los datos de la serie.
Por ejemplo: la multiplicación de toda la serie.
\[ ( x_1 \cdot x_2 \cdot \ldots \cdot x_n ) \]
Sin embargo, el producto anterior está otra escala. \[ ( x \cdot x \cdot \ldots \cdot x_n )=x^n \]
Para tomar en cuenta el tamaño de muestra, y regresar el valor a su escala original \[x=\sqrt[n]{x^n} \]
-\(n\)esima raiz: \[ \overline{x}_g = \sqrt[n]{\left( x_1 \cdot x_2 \cdot \ldots \cdot x_n \right)} \]
-Como una potencia del inverso del tamaño muestral: \[ \overline{x}_g = \left( x_1 \cdot x_2 \cdot \ldots \cdot x_n \right)^{\frac{1}{n}} \]
¿Por qué atenúa la presencia de valores extremos?
\[ (x_1 \cdot x_2)^\frac{1}{n}=x_1^\frac{1}{n} \cdot x_2^\frac{1}{n} \]
\[\ln(x_1^\frac{1}{n} \cdot x_2^\frac{1}{n})= \frac{1}{n} \cdot (\ln(x_1)+\ln(x_2)) \]
\[\exp(\ln(x_1)) = x_1 \]
\[ \overline{x}_g = \exp(\frac{1}{n} \cdot(\ln(x_1)+\ln(x_2) + \dots +\ln(x_{n-1}) +\ln(x_{n})) \]
¿Por qué es importante esto?
Una mejor representación de la tendencia central:
(20*15*18*90)^(1/4)
## [1] 26.40335
Cuando hay mucha dispersión.
Para calcular el promedio de tasas de crecimiento.
Supongamos que queremos encontrar un valor que represente a una serie de datos.
Por ejemplo, la altura de los hombres en la escuela, tienes 10 datos.
\[\begin{align*} &[1.6, 1.75, 0.68, 1.42, 1.74, \\ &\quad 1.28, 1.78, 1.89, 1.6, 2.02] \end{align*}\]
## [1] 1.519171
Año | PIB | Año.1 | PIB.1 |
---|---|---|---|
2011 | 0.85 | 2016 | 1.97 |
2012 | 2.50 | 2017 | -0.28 |
2013 | 2.70 | 2018 | -8.65 |
2014 | 1.77 | 2019 | 5.84 |
2015 | 1.87 | 2020 | 3.90 |
Año | PIB | F_PIB | Año.1 | PIB.1 | F_PIB.1 |
---|---|---|---|---|---|
2011 | 0.85 | 1.0085 | 2016 | 1.97 | 1.0197 |
2012 | 2.50 | 1.0250 | 2017 | -0.28 | 0.9972 |
2013 | 2.70 | 1.0270 | 2018 | -8.65 | 0.9135 |
2014 | 1.77 | 1.0177 | 2019 | 5.84 | 1.0584 |
2015 | 1.87 | 1.0187 | 2020 | 3.90 | 1.0390 |
## [1] 0.01178093
## ## Promedio Geométrico del PIB MX: 0.01
## Versión: 30/01/2024