Decimos que un resultado de una investigación es «estadísticamente significativo» cuando el valor p<0,05. Pero… ¿Qué nos quiere decir esto?
Con frecuencia se interpreta erróneamente el valor p como una medida de magnitud de asociación entre dos variables (por ejemplo, entre un factor de riesgo y una enfermedad). Pero en realidad no es otra cosa que un modo de expresar una probabilidad de que el resultado obtenido sea atribuible al azar, a la mera casualidad, con un rango que va desde 0 (probabilidad nula de que ocurra el acontecimiento) a 100 (el acontecimiento ocurrirá siempre).
Tradicionalmente se ha establecido (por consenso universal) el límite para determinar la significación estadística en un valor de p=0,05 (equivalente al 5%), lo que significa que hay sólo un 5% probabilidad de que el resultado obtenido ocurriese por casualidad. O dicho de otro modo, que si realizásemos el mismo experimento 100 veces, obtendríamos un resultado positivo debido al azar en 5 ocasiones. Por lo tanto, un valor de p<0,05 significa que la asociación entre las dos variables (factor de riesgo y enfermedad) es poco probable (inferior al 5%) que se deba al azar.
A pesar de la proliferación en los textos científicos de los valores p como medida para evaluar la significación estadística, dado que en la práctica real nos interesa más la magnitud de la diferencia observada que la probabilidad, debiéramos comenzar a decantarnos por emplear los intervalos de confianza (IC) en detrimento de los valores p.
INTERVALOS DE CONFIANZA (IC)
Los IC representan una manera mucho más descriptiva de presentar la significación estadística que el valor p. El IC (generalmente al 95%) presenta el rango de valores o margen de error entre los que es más probable que se encuentre el valor real en una población a partir de la determinación de una muestra, es decir, un rango de seguridad donde se encuentra el verdadero valor. Los límites inferior y superior representan la mínima y máxima diferencia o asociación compatible con los datos.
Un IC95% indica que dentro del rango dado se encuentra el valor real de un parámetro con el 95% de certeza. Esto es, que si tomamos 100 muestras aleatorias de la población, podríamos esperar que aproximadamente 95 de las muestras produzcan intervalos que contengan el valor real.
Además, en función de lo estrecho o ancho que sea rango del IC se puede obtener información sobre la precisión de los resultados. Un IC estrecho implica precisión alta y un amplio IC implica precisión baja. Una manera de estrechar el IC (y aumentar, por ende, la precisión) es aumentar el tamaño muestral: una muestra pequeña ofrecerá IC grandes, al contrario que una muestra amplia.
El uso de IC95% puede emplearse para estimar si existen diferencias entre dos (o más) proporciones. Por ejemplo:
- Si los IC de las dos proporciones NO se solapan, podemos afirmar que SÍ existen diferencias estadísticamente significativas (p<0,05). CASO A.
- Si el valor puntual de un porcentaje de una de las variables está contenido en el IC de la otra, podremos asegurar que NO existen diferencias significativas entre ambas (p>0,05). CASO B.
- Sin embargo, cuando lo que se solapan son los IC pero no están integrados los valores puntuales en ellos… no podemos aseverar nada y deberemos recurrir a otros métodos de contraste. CASO C.
Autoría: Sendoa Ballesteros.
Artículo con revisión editorial. No existen conflictos de interés en relación al presente artículo. Las opiniones expresadas son responsabilidad exclusiva de los/las autores/as y no reflejan, necesariamente, los puntos de vista de los/las editores/as. Artículo bajo licencia de Creative Commons: Reconocimiento 4.0 Internacional.
Este documento debe citarse como: “Ballesteros S. Entendiendo el «valor p» y los intervalos de confianza. [Internet]. Enfermería Activa del Siglo XXI: blog abierto; 8 de noviembre de 2021. Disponible en: www.enfermeriaactiva.com”