La distribución hipergeométrica es un concepto fundamental en estadística que se utiliza para modelar situaciones donde se extraen elementos de una población finita sin reemplazo. Este tipo de distribución es especialmente útil en contextos como la calidad de control, análisis de muestras y cálculos de probabilidad en situaciones concretas. En este artículo exploraremos a fondo qué es la distribución hipergeométrica, cómo se calcula y cómo hacerlo usando una calculadora, ya sea científica o estadística, o incluso a través de herramientas digitales.
¿Qué es la distribución hipergeométrica y cómo se relaciona con la probabilidad?
La distribución hipergeométrica es una distribución de probabilidad discreta que describe la probabilidad de obtener un número específico de éxitos en una muestra de tamaño fijo, extraída sin reemplazo de una población finita que contiene un número conocido de éxitos. A diferencia de la distribución binomial, donde cada prueba es independiente, en la hipergeométrica las extracciones están relacionadas entre sí, ya que una vez que se selecciona un elemento, no vuelve a la población.
Un ejemplo clásico es el siguiente: supongamos que tenemos una caja con 50 bombillos, de los cuales 5 son defectuosos. Si extraemos una muestra de 10 bombillos sin reemplazo, la distribución hipergeométrica nos permitirá calcular la probabilidad de que exactamente 2 de esos 10 sean defectuosos.
¿Cómo se diferencia la distribución hipergeométrica de otras distribuciones de probabilidad?
Una de las diferencias más importantes es que la distribución hipergeométrica se aplica a poblaciones finitas y a muestreos sin reemplazo, mientras que la distribución binomial asume pruebas independientes y con reemplazo. Por ejemplo, si lanzamos una moneda varias veces, cada lanzamiento es independiente, por lo que usamos la binomial. Pero si extraemos cartas de una baraja sin devolverlas, usamos la hipergeométrica.
Además, la hipergeométrica se suele aplicar en situaciones donde el tamaño de la muestra es significativo en comparación con el tamaño total de la población. En estos casos, el muestreo sin reemplazo afecta la probabilidad de cada extracción sucesiva. Por otro lado, cuando el tamaño de la muestra es pequeño en relación con la población total, la binomial puede ser una aproximación aceptable.
¿Cuándo es más adecuado usar la hipergeométrica que la binomial?
La elección entre una distribución u otra depende del contexto. La distribución hipergeométrica es más adecuada cuando:
- La población es finita y relativamente pequeña.
- Las extracciones se realizan sin reemplazo.
- El tamaño de la muestra representa una proporción significativa de la población.
Por ejemplo, en un control de calidad donde se inspecciona una muestra de productos de un lote limitado, la hipergeométrica es más precisa que la binomial. En contraste, cuando se lanza una moneda 100 veces, cada lanzamiento es independiente, por lo que la binomial es la opción correcta.
Ejemplos prácticos de la distribución hipergeométrica
Veamos algunos ejemplos para ilustrar su uso:
- Ejemplo 1: En una urna hay 10 bolas, 4 rojas y 6 azules. Se extraen 3 bolas sin reemplazo. ¿Cuál es la probabilidad de que exactamente 2 sean rojas?
- Parámetros:
- N = 10 (total de bolas)
- K = 4 (bolas rojas)
- n = 3 (tamaño de la muestra)
- k = 2 (éxitos deseados)
Aplicamos la fórmula de la distribución hipergeométrica:
$$
P(X = k) = \frac{{\binom{K}{k} \binom{N-K}{n-k}}}{{\binom{N}{n}}}
$$
$$
P(X = 2) = \frac{{\binom{4}{2} \binom{6}{1}}}{{\binom{10}{3}}} = \frac{{6 \times 6}}{{120}} = 0.3
$$
- Ejemplo 2: En una empresa hay 20 empleados, 8 de los cuales son ingenieros. Se eligen 5 al azar. ¿Cuál es la probabilidad de que 3 sean ingenieros?
- Parámetros:
- N = 20
- K = 8
- n = 5
- k = 3
$$
P(X = 3) = \frac{{\binom{8}{3} \binom{12}{2}}}{{\binom{20}{5}}}
$$
Este cálculo se puede hacer manualmente o con una calculadora estadística.
¿Cómo se calcula la distribución hipergeométrica paso a paso?
Para calcular la distribución hipergeométrica, es necesario seguir estos pasos:
- Identificar los parámetros:
- N: Tamaño total de la población.
- K: Número de elementos con la característica deseada en la población.
- n: Tamaño de la muestra.
- k: Número de elementos con la característica deseada en la muestra.
- Aplicar la fórmula:
$$
P(X = k) = \frac{{\binom{K}{k} \binom{N – K}{n – k}}}{{\binom{N}{n}}}
$$
- Calcular los coeficientes binomiales:
- $\binom{K}{k}$: Combinaciones de K elementos tomados de k en k.
- $\binom{N – K}{n – k}$: Combinaciones restantes.
- $\binom{N}{n}$: Total de combinaciones posibles.
- Realizar las operaciones:
- Multiplicar los numeradores y dividir entre el denominador.
- Simplificar para obtener la probabilidad final.
Recopilación de fórmulas y parámetros clave en la distribución hipergeométrica
A continuación, una tabla resumen de los parámetros y fórmulas esenciales:
| Parámetro | Descripción |
|———–|————-|
| N | Tamaño total de la población |
| K | Número de elementos exitosos en la población |
| n | Tamaño de la muestra |
| k | Número de éxitos en la muestra |
| P(X = k) | Probabilidad de obtener exactamente k éxitos |
Fórmula principal:
$$
P(X = k) = \frac{{\binom{K}{k} \binom{N – K}{n – k}}}{{\binom{N}{n}}}
$$
Además, existen fórmulas para calcular la media y varianza:
- Media: $ \mu = n \cdot \frac{K}{N} $
- Varianza: $ \sigma^2 = n \cdot \frac{K}{N} \cdot \left(1 – \frac{K}{N}\right) \cdot \left(\frac{N – n}{N – 1}\right) $
¿Cómo usar la distribución hipergeométrica en la vida real?
La distribución hipergeométrica tiene aplicaciones prácticas en múltiples campos. Por ejemplo, en ingeniería, se utiliza para calcular la probabilidad de que cierto número de componentes defectuosos se encuentre en una muestra de un lote de producción. En biología, puede emplearse para analizar la presencia de ciertos genes en una muestra de ADN. En negocios, puede ayudar a predecir la probabilidad de éxito en campañas de marketing con muestreo limitado.
También se usa en juegos de azar, como en el cálculo de probabilidades en el póker o en loterías donde se extraen bolas sin reemplazo. En todos estos casos, el muestreo sin reemplazo afecta directamente la probabilidad de los resultados futuros, algo que la hipergeométrica modela con precisión.
¿Para qué sirve la distribución hipergeométrica en la estadística inferencial?
La distribución hipergeométrica es clave en la estadística inferencial porque permite hacer inferencias sobre una población a partir de una muestra cuando no se puede asumir independencia entre las observaciones. Por ejemplo, si queremos estimar la proporción de clientes satisfechos en una empresa, y tomamos una muestra de 50 de 200 clientes, la hipergeométrica nos permite calcular la probabilidad de obtener cierto número de respuestas positivas sin necesidad de asumir que cada cliente es independiente.
También se usa para calcular intervalos de confianza o realizar pruebas de hipótesis en poblaciones pequeñas, donde el muestreo sin reemplazo tiene un impacto significativo. En resumen, es una herramienta esencial para situaciones donde el muestreo afecta la probabilidad de los resultados.
¿Cuál es la relación entre la hipergeométrica y la distribución binomial?
Aunque ambas distribuciones modelan la probabilidad de ciertos éxitos, tienen diferencias clave. La binomial asume pruebas independientes y con reemplazo, mientras que la hipergeométrica se usa cuando las extracciones son sin reemplazo y en una población finita.
Cuando el tamaño de la población es grande en comparación con el tamaño de la muestra, la hipergeométrica se aproxima a la binomial. Por ejemplo, si se extraen 10 cartas de una baraja de 52, la diferencia entre usar una u otra es mínima. Pero si la muestra representa una proporción significativa de la población, la hipergeométrica es más precisa.
¿Cuáles son las ventajas de usar la hipergeométrica sobre otras distribuciones?
Algunas de las ventajas clave de usar la distribución hipergeométrica son:
- Precisión en poblaciones finitas: Es ideal para muestreos sin reemplazo en poblaciones pequeñas.
- Mayor realismo en ciertos contextos: Representa con mayor fidelidad situaciones reales donde el muestreo afecta la probabilidad futura.
- Aplicabilidad en control de calidad: Permite calcular con exactitud la probabilidad de encontrar defectuosos en un lote limitado.
- Uso en muestreos complejos: Es útil en estudios sociales, biológicos y económicos donde el muestreo es limitado.
En resumen, la hipergeométrica es una herramienta poderosa para modelar situaciones reales donde el muestreo sin reemplazo tiene un impacto significativo.
¿Qué significa la distribución hipergeométrica en términos matemáticos?
Matemáticamente, la distribución hipergeométrica se define por la probabilidad de obtener exactamente k éxitos en una muestra de tamaño n, extraída sin reemplazo de una población de N elementos, de los cuales K son éxitos. Su función de probabilidad se define como:
$$
P(X = k) = \frac{{\binom{K}{k} \binom{N – K}{n – k}}}{{\binom{N}{n}}}
$$
Donde:
- $ \binom{K}{k} $ es el número de maneras de elegir k éxitos de K posibles.
- $ \binom{N – K}{n – k} $ es el número de maneras de elegir el resto de elementos.
- $ \binom{N}{n} $ es el número total de maneras de elegir una muestra de tamaño n de una población de tamaño N.
Esta fórmula es fundamental para calcular la probabilidad exacta de obtener cierto número de éxitos en una muestra sin reemplazo, algo que no se puede lograr con la binomial.
¿Cuál es el origen de la distribución hipergeométrica?
La distribución hipergeométrica tiene sus raíces en el desarrollo de la teoría de probabilidades en el siglo XVIII. Fue introducida como una extensión de la distribución binomial, con la intención de modelar situaciones donde el muestreo no era independiente. Aunque no fue formalizada hasta el siglo XIX, sus fundamentos se remontan a los trabajos de matemáticos como Abraham de Moivre y Pierre-Simon Laplace.
Su nombre proviene del hecho de que la función que describe la probabilidad de éxito en cada extracción se relaciona con una serie hipergeométrica, una serie matemática especial que se usaba en cálculos de probabilidad antes de la computación moderna.
¿Cómo se puede aplicar la distribución hipergeométrica en control de calidad?
En el control de calidad, la hipergeométrica es una herramienta fundamental. Por ejemplo, si un fabricante quiere asegurarse de que no más del 5% de sus productos sea defectuoso, puede usar esta distribución para calcular la probabilidad de que, al inspeccionar una muestra, encuentre cierto número de defectuosos. Esto permite tomar decisiones informadas sobre el rechazo o aceptación de lotes completos.
Otro ejemplo es en la inspección de componentes electrónicos: si una empresa recibe un lote de 1000 componentes y sospecha que 50 son defectuosos, puede calcular la probabilidad de encontrar al menos 3 defectuosos en una muestra de 50, usando la hipergeométrica. Esto ayuda a decidir si el lote debe ser inspeccionado al 100% o rechazado.
¿Cómo se calcula la hipergeométrica en una calculadora?
Para calcular la distribución hipergeométrica en una calculadora científica o estadística, sigue estos pasos:
- Verifica si tu calculadora tiene función de distribución hipergeométrica:
- Algunas calculadoras avanzadas, como la TI-84 o Casio fx-9860G, tienen una función específica para esto.
- Accede al menú de distribución estadística:
- En la TI-84, ve a `2nd` + `VARS` (DISTR), luego selecciona `8:hpgeofcdf` para calcular probabilidades acumuladas o `7:hpgeofpdf` para calcular una probabilidad específica.
- Introduce los parámetros:
- N = tamaño de la población
- K = número de éxitos en la población
- n = tamaño de la muestra
- k = número de éxitos en la muestra
- Obtén el resultado:
- La calculadora te devolverá la probabilidad de obtener exactamente k éxitos.
Si tu calculadora no tiene esta función, puedes usar una calculadora en línea o software estadístico como Excel, R o Python.
¿Cómo usar la distribución hipergeométrica en Excel o Google Sheets?
Excel y Google Sheets ofrecen funciones para calcular la distribución hipergeométrica:
- En Excel, usa la función:
«`
=HIPERGEOM.DIST(k, n, K, N, acumulada)
«`
- `k`: Número de éxitos en la muestra.
- `n`: Tamaño de la muestra.
- `K`: Número de éxitos en la población.
- `N`: Tamaño total de la población.
- `acumulada`: `VERDADERO` para la función acumulada, `FALSO` para la probabilidad exacta.
- En Google Sheets, la función es similar:
«`
=HYPGEOM.DIST(k, n, K, N, acumulada)
«`
Ejemplo:
«`
=HIPERGEOM.DIST(2, 3, 4, 10, FALSO)
«`
Devuelve la probabilidad de obtener exactamente 2 éxitos en una muestra de 3, extraída de una población de 10 con 4 éxitos.
¿Cuáles son las limitaciones de la distribución hipergeométrica?
Aunque la distribución hipergeométrica es muy útil en ciertos contextos, tiene algunas limitaciones:
- Requiere conocimiento preciso de la población: Si no se conoce el número exacto de éxitos en la población, no es posible aplicar la fórmula correctamente.
- Es más compleja que la binomial: Requiere cálculos más avanzados, lo que puede dificultar su uso en situaciones donde se necesita una aproximación rápida.
- No se aplica a poblaciones infinitas: Para poblaciones grandes, es preferible usar la binomial o una aproximación normal.
A pesar de estas limitaciones, en contextos donde el muestreo sin reemplazo es relevante, la hipergeométrica sigue siendo la herramienta más precisa.
¿Cómo puedo interpretar los resultados de la distribución hipergeométrica?
Interpretar los resultados implica entender qué probabilidad tiene un evento específico de ocurrir. Por ejemplo, si obtienes un resultado de 0.3 al calcular la probabilidad de que 2 de 3 extracciones sean exitosas, esto significa que hay un 30% de posibilidades de que ocurra ese evento.
Además, puedes calcular la probabilidad acumulada para obtener un rango de resultados. Por ejemplo, si quieres saber la probabilidad de que 1, 2 o 3 de tus extracciones sean exitosas, sumarás las probabilidades individuales de cada uno.
La interpretación también puede ayudarte a tomar decisiones, como aceptar o rechazar un lote de productos, o evaluar la eficacia de un experimento.
Yara es una entusiasta de la cocina saludable y rápida. Se especializa en la preparación de comidas (meal prep) y en recetas que requieren menos de 30 minutos, ideal para profesionales ocupados y familias.
INDICE

