2024-04-23
Dominio: El dominio de una distribución de probabilidad se refiere al conjunto de todos los posibles valores que puede tomar la variable aleatoria asociada. Este dominio puede ser cualquier combinación de números reales, dependiendo del tipo de distribución.
Contradominio (Rango): El rango de una distribución de probabilidad, es decir, los valores que puede tomar la función de probabilidad, efectivamente está entre 0 y 1. Esto se debe a que las probabilidades no pueden ser negativas y la suma de las probabilidades de todos los posibles resultados debe ser igual a
Los momentos son medidas cuantitativas que describen características de una distribución.
Primer Momento (Media o Valor Esperado): Representa el promedio ponderado de todos los posibles valores que puede tomar la variable aleatoria.
Segundo Momento (Varianza): Mide la dispersión de los valores alrededor de la media.
Tercer Momento (Asimetría o Skewness): Indica la simetría de la distribución. Una distribución con asimetría positiva tiene una cola más larga hacia la derecha; si es negativa, la cola es más larga hacia la izquierda.
Cuarto Momento (Curtosis): Mide la “gordura” de las colas de la distribución. Una curtosis alta indica colas más pesadas y una mayor presencia de valores atípicos en las colas.
Curtosis:
Tipo de Distribución | Interpretación de Curtosis | Rango Aceptable (en valor absoluto) |
---|---|---|
Distribución Mesocúrtica (Kurtosis ≈ 0) | Colas similares a una distribución normal (con forma de campana). | \(| \text{Curtosis} | < 2\) |
Distribución Leptocúrtica (Kurtosis positiva) | Colas más pesadas que una distribución normal. | \(| \text{Curtosis} | > 2\) |
Distribución Platicúrtica (Kurtosis negativa) | Colas más ligeras que una distribución normal. Valores más cercanos a la media. | \(| \text{Curtosis} | > 2\) |
La distribución uniforme describe un escenario donde todos los resultados posibles tienen la misma probabilidad de ocurrir.
Ejemplo clásico: Lanzamiento de un dado justo.
La PMF de una variable aleatoria (X) con distribución uniforme discreta en el conjunto \(S = {x_1, x_2, \ldots, x_n}\) es:
\[ P(X = x_i) = \frac{1}{n} \quad \text{para } i = 1, 2, \ldots, n \]
Si \(X\) es una variable aleatoria que representa el resultado de lanzar un dado, entonces \(X\) tiene una distribución uniforme discreta con probabilidad \(P(X=x) = \frac{1}{6}\) para \(x = 1, 2, 3, 4, 5, 6\).
Si \(X\) es una variable aleatoria que representa la ocupación de una mesa en un restaurante. \(P(X=x) = \frac{1}{10}\) para \(x = 1, 2, \dots, 10\).
Si \(X\) es una variable aleatoria que representa la venta de un modelo de arete con tres tipos de colores.\(P(X=x) = \frac{1}{3}\) para \(x = Azul, Verde, Rojo\).
Valor Esperado (Media): \(E(X) = \frac{1}{n} \sum_{i=1}^{n} x_i\)
Varianza: \(Var(X) = \frac{1}{n} \sum_{i=1}^{n} (x_i - E(X))^2\)
Asimetría o Sesgo (Skewness): \(γ = E[(X - µ)^3] / σ^3\)
Kurtosis: \(κ = E[(X - µ)^4] / σ^4 - 3\)
Media (\(\mu\)): La media de un dado justo de seis caras es el promedio de todos los resultados posibles:
\[ \mu = \frac{1 + 2 + 3 + 4 + 5 + 6}{6} = 3.5 \]
Cuarto Momento Central (\(\mu_4\)): El cuarto momento central para una distribución uniforme discreta es:
\[ \mu_4 = \frac{1}{n} \sum_{i=1}^{n} (x_i - \mu)^4 = = 14.72917\]
Varianza (\(\sigma^2\)): La varianza para un dado justo de seis caras es:
\[ \sigma^2 = \frac{1}{6} \sum_{i=1}^{6} (x_i - 3.5)^2=2.9166 \]
Exceso de Curtosis: El exceso de curtosis se calcula utilizando:
\[ \text{Exceso de Curtosis} = \frac{\mu_4}{\sigma^4} - 3 \]
Sustituyendo los valores que tenemos:
\[ \text{Exceso de Curtosis} = \frac{14.73}{\left(2.9166\right)^2} - 3 \]
## [1] -1.268571
Supongamos que una empresa de comercio electrónico está llevando a cabo una campaña de marketing por correo electrónico para promocionar un nuevo producto. La tasa de conversión estimada (probabilidad de que un destinatario realice una compra después de recibir el correo) es del 5%. La empresa planea enviar el correo a 2000 destinatarios. ¿Cual es la probabilidad de que exactamente 50 hagan la compra?
Valor Esperado (Media):
\[ E(X) = np \] Donde \(n\) es el número de ensayos (usuarios) y \(p\) es la probabilidad de éxito (tasa de clics).
Varianza:
\[ Var(X) = np(1-p) \]
Asimetría (Skewness):
\[ \text{Skewness} = \frac{1 - 2p}{\sqrt{np(1-p)}} \]
Curtosis:
\[ \text{Curtosis} = \frac{1 - 6p(1-p)}{np(1-p)} \]
En un escenario de negocios, supongamos que una empresa lanza una nueva campaña publicitaria en línea. La campaña tiene una tasa de clics del 10%. Cada vez que se muestra un anuncio, hay una probabilidad del 10% de que un usuario haga clic en él. La empresa planea mostrar el anuncio a \(n = 1000\) usuarios.
## Valor Esperado (Media): 100
## Varianza: 90
## Asimetría (Skewness): 0.0843274
## Curtosis: 0.005111111
Número de Eventos: Una tienda en línea de ropa envía correos electrónicos promocionales a 5000 clientes.
Probabilidad de Éxito: La probabilidad de que un cliente realice una compra después de recibir el correo es del 8%.
¿Cuántos clientes se espera que realicen una compra? (Valor esperado)
Utilizando la fórmula de la media de la distribución binomial: \[ E(X) = np \] \[ E(X) = 5000 \times 0.08 = 400 \]
¿Cuál es la probabilidad de que exactamente 200 clientes realicen una compra?
Utilizando la fórmula de la PMF de la distribución binomial: \[ P(X = k) = \binom{n}{k} p^k (1-p)^{n-k} \] \[ P(X = 200) = \binom{5000}{200} (0.08)^{200} (0.92)^{4800} \]
Número de Eventos: Una empresa lanza un nuevo producto y envía muestras a 100 minoristas.
Probabilidad de Éxito: La probabilidad de que un minorista decida vender el producto es del 20%.
¿Cuántos minoristas se espera que vendan el producto? (Valor esperado)
Utilizando la fórmula de la media de la distribución binomial: \[ E(X) = np \] \[ E(X) = 100 \times 0.20 = 20 \]
¿Cuál es la probabilidad de que exactamente 25 minoristas vendan el producto?
Utilizando la fórmula de la PMF de la distribución binomial: \[ P(X = k) = \binom{n}{k} p^k (1-p)^{n-k} \] \[ P(X = 25) = \binom{100}{25} (0.20)^{25} (0.80)^{75} \]
Número de Eventos: Una empresa realiza una encuesta de satisfacción del cliente y envía cuestionarios a 300 clientes.
Probabilidad de Éxito: La probabilidad de que un cliente complete y devuelva el cuestionario es del 15%.
¿Cuántos clientes se espera que completen y devuelvan el cuestionario? (Valor esperado)
Utilizando la fórmula de la media de la distribución binomial: \[ E(X) = np \] \[ E(X) = 300 \times 0.15 = 45 \]
¿Cuál es la probabilidad de que exactamente 40 clientes completen y devuelvan el cuestionario?
Utilizando la fórmula de la PMF de la distribución binomial: \[ P(X = k) = \binom{n}{k} p^k (1-p)^{n-k} \] \[ P(X = 40) = \binom{300}{40} (0.15)^{40} (0.85)^{260} \]
\[ P(X = 0) = (0.85)^{300} \] \[ P(X = 1) = 300 \times (0.15) \times (0.85)^{299} \] \[ P(X = 2) = \frac{300 \times 299}{2 \times 1} \times (0.15)^2 \times (0.85)^{298} \] \[ P(X = 3) = \frac{300!}{3!(300-3)!} (0.15)^3 (0.85)^{297} \]
Supongamos que un restaurante de comida rápida recibe un promedio de 2 pedidos de entrega por hora durante las horas de almuerzo. ¿Cuál es la probabilidad de que el restaurante reciba exactamente 3 pedidos durante la próxima hora?
Valor Esperado (Media): \[ E(X) = \lambda \]
Varianza: \[ Var(X) = \lambda \]
Asimetría (Skewness): \[ \text{Skewness} = \frac{1}{\sqrt{\lambda}} \]
La distribución normal, también conocida como distribución gaussiana, es una de las distribuciones más importantes en estadística. Se caracteriza por su forma de campana y se utiliza ampliamente en modelado y análisis de datos.
\[ µ = E(X) = \frac{1}{n} \sum_{i=1}^{n} x_i \]
\[ σ^2 = Var(X) = E[(X - µ)^2]= \frac{1}{n} \sum_{i=1}^{n} (x_i - E(X))^2 \]
\[γ = E[(X - µ)^3] / σ^3\]
\[κ = E[(X - µ)^4] / σ^4 - 3\]
La distribución normal estándar, también conocida como distribución gaussiana estándar, es una versión especial de la distribución normal con una media (\(\mu\)) de 0 y una desviación estándar (\(\sigma\)) de 1. Se denota como \(Z \sim N(0, 1)\).
\[ f(z) = \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} \]
El Z-score (o puntaje Z) es una medida estandarizada que indica cuántas desviaciones estándar un valor dado se encuentra por encima o por debajo de la media en una distribución normal estándar. Es útil para comparar valores en diferentes escalas y comprender su posición relativa en la distribución.
Para calcular el Z-score de un valor \(x\) en una distribución normal con media \(\mu\) y desviación estándar \(\sigma\):
\[ Z = \frac{x - \mu}{\sigma} \]
Asumiendo que la distribución del IQ sigue una distribución normal, te embarcas en la tarea de calcular la probabilidad de seleccionar un estudiante al azar cuyo IQ se encuentre entre 110 y 120, si conoces que la deviación estándar es de 15 puntos y al media es 100 puntos.
\[ P( 110 < X < 120) = ? \]
(110-100)/15
## [1] 0.6666667
(120-100)/15
## [1] 1.333333
0.00 | 0.01 | 0.02 | 0.03 | 0.04 | 0.05 | 0.06 | 0.07 | 0.08 | 0.09 | |
---|---|---|---|---|---|---|---|---|---|---|
0.60 | 0.2743 | 0.2709 | 0.2676 | 0.2643 | 0.2611 | 0.2578 | 0.2546 | 0.2514 | 0.2483 | 0.2451 |
0.00 | 0.01 | 0.02 | 0.03 | 0.04 | 0.05 | 0.06 | 0.07 | 0.08 | 0.09 | |
---|---|---|---|---|---|---|---|---|---|---|
1.30 | 0.0968 | 0.0951 | 0.0934 | 0.0918 | 0.0901 | 0.0885 | 0.0869 | 0.0853 | 0.0838 | 0.0823 |
Para calcular la probabilidad \(P( 110 < X < 120) =\):
Entonces, \(P(X>110)-P(X>120)=0.2546 - 0.0918=0.1628\)
## Versión: 29/04/2024
Dodge, Y. (2008). The concise encyclopedia of statistics. Springer Science & Business Media.
Business Mathematics.(2023).SBPD https://www.google.com.mx/books/edition/Business_Mathematics/oRLFEAAAQBAJ
Smith, G. (2015). Essential statistics, regression, and econometrics.
Spiegel, M. R., Srinivasan, R. A., & Schiller, J. J. (2000). Schaum’s outline of theory and problems of probability and statistics. Erlangga.