Este artículo es la Parte 13 de una colección de artículos sobre estadísticas en ingeniería eléctrica. Hemos cubierto mucho hasta ahora, así que si acaba de unirse a la serie, asegúrese de revisar la lista de temas a continuación.
Analizar estadísticas como ingeniero eléctrico
Estadísticas descriptivas
Medidas estadísticas descriptivas: desviación promedio, desviación estándar y varianza
La distribución gaussiana, histogramas y probabilidad
La función de distribución acumulativa gaussiana en el análisis estadístico
Pruebas paramétricas, asimetría y curtosis
Tres formas de encontrar relaciones estadísticas
Introduciendo la distribución normal
Introducción de la distribución t para encontrar la significación estadística
Comprender la importancia estadística en el análisis de datos
Usar coeficientes de correlación para encontrar relaciones estadísticas
Comprender los valores t y probar la significancia estadística

Una hipótesis de laboratorio: ¿Qué está causando un PER alto?

Imaginemos que estamos desarrollando un sistema de comunicación inalámbrica. El sistema consta de un transmisor que envía datos digitales empaquetados a un receptor, y nuestro medio principal de cuantificar el rendimiento es la tasa de error de paquete (PER). El receptor utiliza una verificación de redundancia cíclica (CRC) para identificar y descartar paquetes que tienen uno o más bits erróneos, y el PER es simplemente la relación entre los paquetes descartados y los paquetes recibidos.
Hemos estado probando y caracterizando el sistema en el laboratorio durante meses y, en consecuencia, tenemos una gran cantidad de datos de rendimiento a temperatura ambiente.
Sabemos que cuando el sistema está operando en laboratorio y está configurado con la atenuación correspondiente al rango máximo especificado, alcanza un PER promedio de 0.001, es decir, por cada 1,000 paquetes recibidos, se debe descartar un paquete.

Solución de problemas estadísticos

Lamentablemente, hemos realizado varias pruebas de campo durante las últimas semanas y el sistema no funcionó muy bien.
No hubo una causa obvia para el PER más alto, y ningún patrón fue evidente de inmediato. Por lo tanto, tendremos que crear algunos experimentos de solución de problemas en un intento de rastrear los problemas. Varias cosas cambian cuando un sistema se mueve del laboratorio al campo, pero dado que las pruebas de campo se llevaron a cabo en el Valle de la Muerte, la temperatura probablemente sea la culpable.
Nuestro plan es subir el termostato en el laboratorio y recopilar algunos datos PER. El sistema no está diseñado para funcionar a temperaturas extremas, por lo que no es necesario realizar pruebas a 125 ° C o incluso a 70 ° C. Intentaremos 40 ° C y, dado que es caro mantener el laboratorio a esta temperatura durante largos períodos de tiempo, no podremos recopilar grandes cantidades de datos.
…Tres días después…
Hemos recopilado nueve mediciones PER de 40 ° C. Cada medición representa el PER observado durante un período de funcionamiento de dos horas. En otras palabras, calentamos el laboratorio, activamos el sistema, lo dejamos funcionar durante dos horas y registramos el PER.
Luego desactivamos el sistema, lo dejamos permanecer inactivo por un tiempo, lo reactivamos y registramos un nuevo dato PER para un nuevo período de operación de dos horas. Con tres períodos de prueba de dos horas por día durante tres días, tenemos nueve puntos de datos.
Estos son los valores de PER que obtuvimos:

POR
0,0010290
0,0010113
0,0010380
0,0010198
0.0009702
0,0010486
0,0010503
0.0009941
0,0010067

Con solo mirar las mediciones, podemos ver que el PER tiende a ser más alto que el valor de temperatura ambiente de 0.001, pero necesitamos examinar los datos con más cuidado para determinar si el cambio en PER es estadísticamente significativo.

Realización de la prueba t

Una prueba t requiere un valor t, y vimos en el artículo anterior que calculamos un valor t de la siguiente manera:

(t = frac { bar {x} – mu} {s / sqrt {n}} )

donde ( bar {x} ) es la media de la muestra, μ es la media de la población (o más generalmente, algún valor de referencia que sirve como punto de comparación), s es la desviación estándar de la muestra y n es el tamaño de la muestra.
En este experimento μ = 0,001, es decir, el PER a temperatura ambiente. El tamaño de la muestra es 9 y, con la ayuda de Excel, puedo encontrar rápidamente la media de la muestra y la desviación estándar de la muestra: ( bar {x} = 0.001018667 ) ys = 2.62881 × 10-5. Así,

(t = frac {0.001018667-0.001} {2.62881 times10 ^ {- 5} / sqrt {9}} approx 2.13 )

Ahora tenemos nuestro valor t. El siguiente paso es encontrar el umbral con el que se comparará este valor t; a esto lo llamamos el valor crítico, denotado por t *. Las tres piezas de información que necesitamos son los grados de libertad (indicados por ν) de nuestros datos experimentales, el nivel de significancia y si realizaremos una prueba de una o dos colas.
Creo que el 5% (⍺ = 0.05) es un nivel de significación razonable para un experimento como este, y ν = n – 1 = 8. Suponemos que el aumento de la temperatura no tendrá ningún efecto o degradará el PER; no mejorará el PER. Por lo tanto, realizaremos una prueba de una cola.
Mirando nuestra tabla de valores críticos de distribución t, vemos que t * = 1.86.

La hipótesis nula de nuestro experimento establece que no existe una relación significativa entre la temperatura y el PER. Nuestro valor t obtenido de 2,13 es mayor que 1,86 y, por tanto, se encuentra en la región de rechazo de la distribución. Por lo tanto, rechazamos la hipótesis nula y afirmamos que efectivamente existe una relación entre las variables de interés: una temperatura más alta se correlaciona con un PER más alto.

Conclusión

Hemos trabajado con un ejemplo sencillo de prueba de significancia como técnica para solucionar problemas de un sistema electrónico. Extenderemos este experimento imaginario al próximo artículo a medida que continuamos con nuestra exploración de la prueba t.

Dejar respuesta

Please enter your comment!
Please enter your name here