Intervalos de confianza de una proporción en R

Calcular los intervalos de confianza para una proporción o un índice es muy sencillo. En R existen diferentes métodos para poder realizarlo, aunque en esta entrada vamos a emplear la función binom.test() del paquete stats.

Calcular los intervalos de confianza de una proporción

Imaginémonos que estamos estudiando un yacimiento arqueológico donde hemos descubierto 18 esqueletos humanos. Mediante el uso de métodos antropológicos, hemos descubierto que 12 de ellos pertenecen a mujeres y 6 a hombres. Por lo tanto, la proporción sería 2:1 en favor de las mujeres.

Con estos datos, podríamos estar tentados de escribir en un artículo que en ese yacimiento existían más mujeres que hombres. Es decir, que no existía un balance equilibrado entre hombres y mujeres al esperado 1:1.

Sin embargo, para poder afirmar con rotundidad que la población no está equilibrada, tenemos que calcular los intervalos de confianza de una proporción. Como en una población normal la probabilidad de que salga hombre o mujer es 0.5 cada uno (proporción 1:1), este valor va a ser el punto de partida. Si los intervalos de confianza de la proporción incluyen este valor de 0.5, no podríamos decir que la proporción observada estuviese fuera de una proporción 1:1.

Intervalos de confianza de una proporción en R con binom.test()

Para poder resolver esta cuestión en R, empleamos la función binom.test() del paquete stats. Esta función ejecuta un test binomial exacto. Prácticamente seguro que este paquete ya lo tenéis instalado, por por si acaso lo instalamos y cargamos.

install.packages("stats", dependencies = TRUE)
library(stats)

En esta función hay que poner principalmente 5 argumentos:

  • El número de mujeres (12).
  • El número total de esqueletos (18).
  • La proporción esperada, que es 1:1 (0.5).
  • El contraste a realizar, en nuestro caso bilateral (alternative = "two.sided").
  • El nivel de confianza (conf.level = 0.95).
binom.test(12, 18,                    # número de mujeres y total
           0.5,                       # proporción ideal  
           alternative = "two.sided", # contraste
           conf.level = 0.95)         # nivel de confianza
## 
##  Exact binomial test
## 
## data:  12 and 18
## number of successes = 12, number of trials = 18, p-value = 0.2379
## alternative hypothesis: true probability of success is not equal to 0.5
## 95 percent confidence interval:
##  0.4099252 0.8665726
## sample estimates:
## probability of success 
##              0.6666667

Las hipótesis a testear han sido:

  • H0: la proporción observada encaja con una proporción ideal 1:1 (0.5), donde machos y hembras están igualmente representados.
  • H1: la proporción observada no encaja con una proporción ideal 1:1 (0.5), por lo tanto, habría un sesgo en favor de las mujeres respecto a hombres.

El resultado indica que su p-valor es mayor de 0.05 (p-value = 0.2379), por lo que aceptamos la hipótesis nula (H0). Esto nos indica que a pesar de que se observe una proporción 2:1 en nuestro yacimento, no existe suficiente evidencia estadística para indicar que no provengan de una proporción ideal 1:1, donde ambos sexos estuvieran igualmente representados.

Si atendemos al intervalo de confianza al 95% de la proporción, observamos que se sitúa entre 0.41 y 0.87. Como la proporción ideal sería 0.5, y este valor se sitúa en ese intervalo`, no existe suficiente evidencia para indicar que realmente existiera un sesgo en favor de las mujeres Obviamente este intervalo guarda una relación estrecha con el p-valor.

Si ejecutamos el test binomial exacto para los hombres, observamos que el p-valor es idéntico al obtenido para las mujeres. Su intervalo de confianza cambia, lógicamente, aunque el valor de 0.5 ideal también se encuentra incluido en el mismo. Esto indica nuevamente que la proporción observada podría haberse obtenido de una población sexualmente equitativa.

binom.test(6, 18,
           0.5,
           alternative = "two.sided",
           conf.level = 0.95)
## 
##  Exact binomial test
## 
## data:  6 and 18
## number of successes = 6, number of trials = 18, p-value = 0.2379
## alternative hypothesis: true probability of success is not equal to 0.5
## 95 percent confidence interval:
##  0.1334274 0.5900748
## sample estimates:
## probability of success 
##              0.3333333