Bienvenido a la Parte 11 de la serie de Robert Keim sobre estadísticas en ingeniería eléctrica. Hasta ahora, hemos abordado tanto definiciones de alto nivel como ejemplos específicos de conceptos estadísticos para el ingeniero práctico. Para ponerse al día con lo que hemos cubierto, revise los artículos que se enumeran a continuación:
¿Cómo utilizan los ingenieros eléctricos el análisis estadístico?
¿Cómo utilizan los ingenieros eléctricos las estadísticas descriptivas?
Tres medidas estadísticas descriptivas en el procesamiento de señales
Comprensión de la corrección de Bessel para estimar cálculos de desviación estándar
¿Cuál es la distribución normal en ingeniería eléctrica?
Comprender la distribución normal, los histogramas y la probabilidad.
El valor de la función de distribución acumulativa gaussiana en el análisis estadístico
Una revisión de las pruebas paramétricas, la asimetría y la curtosis
Usar correlación, causalidad y covarianza para comprender las relaciones estadísticas
Encontrar relaciones estadísticas con coeficientes de correlación

Importancia estadística: ¿un concepto nebuloso?

Cualquiera que lea habitualmente artículos de investigación encontrará con frecuencia "significación estadística", a menudo acompañada de una referencia críptica a p <0,01 o p <0,05.
La importancia estadística es una herramienta fundamental que ayuda a los investigadores a comprender qué han revelado sus experimentos y sus datos, y ayuda a los colegas a decidir si los resultados informados merecen una mayor consideración o investigación.
Al mismo tiempo, la significancia estadística es un concepto algo opaco que se malinterpreta fácilmente y que ha generado bastante controversia en la comunidad científica.
De hecho, no hace mucho tiempo, tres profesores publicaron un artículo de "Comentario" en la revista Nature que recomendaba el abandono total de la significación estadística como base para aceptar o rechazar una hipótesis, y solo les llevó una semana encontrar otros 800 académicos y investigadores que estaban dispuestos a expresar un acuerdo formal con su puesto.

¿Qué es la importancia estadística?

Un experimento comienza con un hipótesis nula, que establece que no existe relación entre los dos fenómenos para los que se recopilarán datos. Si el objetivo del experimento es encontrar o demostrar algún tipo de relación o efecto, la hipótesis nula equivale a decir que el experimento "fallará".
La significancia estadística es un criterio matemático que podemos usar para decidir si debemos aceptar o rechazar la hipótesis nula.
Un resultado que es estadísticamente significativo basado en un umbral de probabilidad predeterminado indica que debemos rechazar la hipótesis nula; en otras palabras, algo sucedió —se observó una relación, se produjo un efecto, existe una asociación— y, por lo tanto, el experimento ha revelado algo que es potencialmente significativo o interesante.
Los fenómenos gobernados por procesos aleatorios suelen producir una distribución normal de valores. Por lo tanto, es una práctica común representar una hipótesis nula conceptual como una curva de Gauss, lo que significa que esta es la distribución de observaciones que esperamos cuando una variable experimental no se ve afectada por la otra variable experimental.


Si asumimos que la hipótesis nula es cierta, a menudo usaremos una curva gaussiana como función de densidad de probabilidad con la que decidimos si un resultado es estadísticamente significativo o no.

El umbral de probabilidad

La significancia estadística se basa en la probabilidad de obtener un resultado bajo el supuesto de que la hipótesis nula es verdadera. Supongamos que a través de nuestro experimento obtuvimos el número x (esto podría ser cualquier cosa: presión arterial, ingresos por ventas, un puntaje promedio de prueba).
Refiriéndonos a la función de densidad de probabilidad asociada con la hipótesis nula, podemos determinar si la probabilidad de obtener x, o algún otro número que sea más improbable que x, será menor al 5% (p <0.05), o al 1% ( p <0.01), o algún otro umbral (p <⍺, donde ⍺ denota el Nivel significativo).
Por lo tanto, la valor p transmite la probabilidad de obtener un resultado igual o más extremo que el resultado observado cuando no existe relación entre las variables de interés.


La curva de Gauss es la función de densidad de probabilidad que corresponde a la distribución de valores cuando la hipótesis nula es verdadera. Calculamos el valor p de un resultado observado integrando una parte de esta función de densidad de probabilidad.

Si el valor p es suficientemente bajo, no tiene sentido continuar asumiendo que no existe relación entre las dos variables. Por lo tanto, rechazamos la hipótesis nula y afirmamos que existe una relación.

Interpretación de la importancia estadística

La explicación anterior describe la significancia estadística de la manera que considero más sencilla y matemáticamente coherente: si el valor p de un resultado observado es menor que el umbral predeterminado que llamamos nivel de significancia, es muy poco probable que ocurra el resultado observado. si la hipótesis nula es cierta. Por tanto, rechazamos la hipótesis nula, lo que equivale a afirmar que el experimento ha encontrado una relación entre las variables de interés.
Este mismo mensaje general se puede transmitir de otras formas que pueden resultarle útiles:
El valor p es la probabilidad de que nuestras observaciones sean atribuibles a la mera casualidad. Por lo tanto, si p = 0.05, hay un 5% de probabilidad de que el resultado sea atribuible al azar y un 95% de probabilidad de que sea atribuible a las condiciones que creamos en nuestro experimento.
El valor p es la probabilidad de que inferiremos incorrectamente una relación entre las variables de interés. Un valor p de 0.05, entonces, indica que por cada 100 experimentos en los que inferimos una relación, 95 de estas relaciones realmente existieron y 5 no existieron.

Interpretación de la palabra "significado"
Mucha confusión en torno a la significación estadística se origina en el uso de la palabra "significación", que en este contexto se limita a un uso estadístico específico y no es lo mismo que la palabra "significación" en el lenguaje ordinario.
Los resultados estadísticamente significativos no son necesariamente resultados importantes o significativos. La significación estadística no significa significación práctica y, de la misma forma, la ausencia de significación estadística no significa que los resultados experimentales no tengan valor práctico.

El nivel de significación

Para establecer la significancia estadística, debemos comparar el valor p con el nivel de significancia, denotado por ⍺. Los niveles de significancia son algo arbitrarios y se seleccionan de acuerdo con las convenciones de un campo dado. Como se indicó anteriormente, ⍺ = 0.05 y ⍺ = 0.01 son comunes, aunque en algunos casos se elige un valor más alto o un valor mucho más bajo.

Conclusión

A pesar del posible uso indebido de la importancia estadística y la evidencia de una mala interpretación generalizada, sigue siendo una técnica importante en la investigación y la experimentación. Continuaremos explorando este tema en el próximo artículo.

Dejar respuesta

Please enter your comment!
Please enter your name here