Este artículo es una continuación de nuestra serie sobre estadísticas en ingeniería eléctrica. Los primeros dos artículos sentaron las bases de nuestra discusión, abordando el análisis estadístico y las estadísticas descriptivas.
Luego profundizamos en la desviación promedio, la desviación estándar y la varianza en el procesamiento de la señal, prestando especial atención a la compensación del tamaño de la muestra al calcular las desviaciones estándar. En el artículo anterior, extrapolamos aún más nuestra comprensión de la desviación estándar al explorar su relación con los valores de raíz cuadrática media.
En este artículo, presentaremos el lugar de la distribución normal en la ingeniería eléctrica, específicamente en la evaluación de la función de densidad de probabilidad.

¿Cuál es la distribución normal?

Si mide repetidamente una cantidad que varía más o menos al azar (niveles de voltaje en una señal de ruido, valores de resistencia reales de resistencias de 47 kΩ, puntajes de prueba en una clase de ingeniería, longitudes de las hojas de hierba en un césped, etc.) es es probable que la distribución de valores, a medida que acumule más y más datos, se asemeje gradualmente a la forma que se muestra a continuación.


Un histograma que representa la distribución normal o gaussiana.

Esto se llama el normal o Gaussiano distribución. Sigue la forma familiar de curva de campana, pero es importante usar el nombre "normal" o "gaussiano" en lugar de "curva de campana", porque otros tipos de distribuciones tienen una forma similar. Numerosos fenómenos estudiados en ingeniería, ciencias físicas y ciencias sociales producirán una distribución normal cuando se analizan estadísticamente.

Características de la distribución normal.

La distribución normal es una relación matemáticamente definida que describe valores en un conjunto de datos, y las mediciones de la vida real se aproximan a esta relación a medida que aumenta el tamaño de la muestra. Veamos algunas características importantes de la distribución normal.
La forma general de la distribución se produce al trazar la función (e ^ {- x ^ 2} ).
La forma particular de una distribución normal dada se define completamente por la media y la desviación estándar. En otras palabras, si conoce la media y la desviación estándar de un conjunto de datos normalmente distribuido, puede trazar la forma del histograma.
La media determina dónde estará el centro de la curva, y la desviación estándar determina su ancho aparente. En la distribución que se muestra arriba, la media es 0 y la desviación estándar es 5.
Aunque en teoría la curva gaussiana se extiende al infinito positivo y negativo, el número esperado de ocurrencias se vuelve extremadamente pequeño cuando los valores son más de aproximadamente 3 desviaciones estándar por encima o por debajo de la media.

Histogramas y funciones de densidad de probabilidad

Si reunimos una gran cantidad de datos para una variable que sigue la distribución normal, podemos presentar esos datos como un histograma, y ​​tendrá la forma de la curva Gaussiana. Por otro lado, si conocemos la media y la desviación estándar de los datos, podemos dibujar la función de densidad de probabilidad que corresponde a nuestras observaciones empíricas.
Para esto, utilizamos la siguiente fórmula:

(P (x) = frac {1} { sqrt {2 pi} sigma} e ^ { frac {- (x- mu) ^ 2} {2 sigma ^ 2}} )

donde μ es la media y σ es la desviación estándar.
Aquí hay una gráfica de la función de densidad de probabilidad de una variable normalmente distribuida con una media de 0 y una desviación estándar de 5.

La función de densidad de trazado de una variable normalmente distribuida. En este caso, la media es 0 y la desviación estándar es 5.
La función de densidad de trazado de una variable normalmente distribuida. En este caso, la media es 0 y la desviación estándar es 5.

Interpretación de la función de densidad de probabilidad
Al calcular el área bajo una curva P (x) dentro de un intervalo dado (digamos, de –3 a +3), determinamos la probabilidad de que una medición seleccionada aleatoriamente caiga dentro de este intervalo.
Para fines prácticos, también podemos interpretar P (x) como la probabilidad de que una medición seleccionada al azar sea aproximadamente igual a un cierto valor.
Por ejemplo, supongamos que la función de densidad de probabilidad que se muestra arriba corresponde a un histograma que generamos midiendo el voltaje (en milivoltios) de una señal del sensor. Todos los valores se redondearon al milivolt más cercano. La media fue de 0 V y la desviación estándar fue de 5 mV.
Calculamos el P gaussiano (x) usando la fórmula dada anteriormente, y trazamos P (x) para producir una curva que es una representación matemática continua de la distribución de los voltajes medidos del sensor. Ahora, miramos el gráfico y vemos que un valor de 6 mV corresponde a P (x) = 0.04, lo que indica que hay un 4% de posibilidades de que una medición de voltaje seleccionada al azar sea aproximadamente 6 mV.
Me resulta útil pensar en una función de densidad de probabilidad de esta manera, pero recuerda que esta interpretación no es correcta desde una perspectiva estrictamente matemática. La función de densidad de probabilidad es continua y, en consecuencia, una probabilidad es distinta de cero solo durante un intervalo, no en un valor exacto a lo largo del eje horizontal.

Normalización de la función de densidad de probabilidad
Todas las funciones de densidad de probabilidad están normalizadas de modo que el área total debajo de la curva es 1.
Esto tiene sentido: el área debajo de toda la curva nos da la probabilidad de que una medición seleccionada al azar se encuentre dentro del intervalo correspondiente a toda la curva. Dado que existe un 100% de posibilidades de que el valor esté en algún lugar de este intervalo, el resultado de integrar P (x) debe ser 1.
Debido a esta normalización, si trazamos P (x) y el histograma en los mismos ejes, no coincidirán: P (x) se extiende solo de 0 a 0.08 en el eje vertical, mientras que el histograma se extiende de 0 a 8000 ( porque fue generado usando 100,000 puntos de datos).
Sin embargo, si multiplico P (x) por 100,000 e incluyo la curva resultante en el gráfico del histograma, puede ver que la función de densidad de probabilidad gaussiana captura matemáticamente la distribución medida.

La función de densidad de probabilidad gaussiana cuando multiplicamos P (x) por 100,000 e incluimos la curva resultante en el gráfico del histograma.
La función de densidad de probabilidad gaussiana cuando multiplicamos P (x) por 100,000 e incluimos la curva resultante en el gráfico del histograma.

Conclusión

Espero que haya disfrutado este artículo y que haya introducido la distribución normal con un buen equilibrio de consideraciones prácticas y teóricas. Continuaremos nuestra discusión sobre la distribución normal en el próximo artículo.

Dejar respuesta

Please enter your comment!
Please enter your name here