Categories: CienciaNoticias

¿Por qué es tan popular el error cuadrático medio (MSE)?

Un vistazo rápido a la función de pérdida favorita de todos

Imagen creada por el autor. Como estadístico en recuperación, seré el primero en decirles que mi gente es un grupo dolorosamente literal. Donde la gente de IA prefiere nombres más con sabor a ciencia ficción, la gente de estadísticas ama las cosas para hacer exactamente lo que dice en la lata… y en ninguna parte esta actitud es más directa que en las métricas populares MSE y RMSE. es, literalmente, la receta para calcularlos, al revés. Como invocar a un pequeño demonio muy manso. Cómo calcular el error cuadrático medio (MSE): encuentra los errores. (E) Elevas al cuadrado esos errores. (S) Tomas la media (promedio) de los errores al cuadrado. (M)Ta-da, ese es el MSE.Y si está buscando la raíz del error cuadrático medio (RMSE), simplemente saca una raíz cuadrada al final.4. Tomas la raíz. (R) Sí, estos nombres de métricas son tan creativos que duelen. Realmente son solo recetas al revés. Si asimilas lo que es el MSE de esta breve explicación, ¡sigue leyendo! Si no está seguro de qué es un “error” y/o se siente un poco confundido, desvíese rápidamente a mi guía introductoria de MSE aquí. Mire el MSE calculado y optimizado en mi curso: bit.ly/mfml_006La media cuadrática error (MSE) es uno de muchos métrica podrías usar para medir tu modelo‘s actuación. si tomas un aprendizaje automático clase, es probable que lo encuentre muy temprano en el programa de estudios; por lo general, es el primer bebé función de pérdida* por continuo datos. (Si no está seguro de lo que cualquiera de los en negrita (significan las palabras, es posible que desee seguir los enlaces para obtener una introducción suave a cada concepto). Ya ha visto lo que *es* el MSE… pero ¿por qué es tan popular? ¿Por qué parece ser la función de puntuación favorita de todos? Hay algunas razones, y algunas incluso son buenas razones. ¿Por qué desearíamos calcular el MSE?Evaluación del desempeño: ¿qué tan bien le está yendo a nuestro modelo?Modelo mejoramiento: ¿es este el mejor ajuste posible? ¿Podemos acercar el modelo a nuestros puntos de datos? La evaluación del rendimiento y la optimización son dos objetivos diferentes… y no existe una ley del universo que diga que *debe* usar la misma función para ambos. Comprender esta sutileza mitigará una gran cantidad de confusión futura si se queda en ML/AI aplicado. Para esta discusión, supondré que comprende cómo y por qué se usa una función para la evaluación versus la optimización, así que si no está seguro de eso. , ahora podría ser un buen momento para tomar un pequeño desvío. Cuando se trata de modelo evaluación, el MSE es una basura. En serio. Tiene todo lo malo como métrica, comenzando con el hecho de que está en la escala incorrecta (un problema que a menudo se resuelve sacando la raíz cuadrada para trabajar con RMSE en su lugar) pero no termina ahí. También sobrepondera los valores atípicos, lo que hace que tanto el MSE como el RMSE sean confusos de interpretar. Ninguno de los dos refleja fielmente la sentido eso sería más interesante para una persona que quiere saber qué tan equivocado está su modelo en promedio. Para eso, la métrica ideal es algo llamado MAD. Y no hay razón para no usar el MAD para la evaluación: es fácil de calcular. Entonces, ¿por qué todos están tan obsesionados con el MSE? ¿Por qué es la primera función de puntuación modelo que aprendes? Porque es realmente excelente para un propósito diferente: optimización, no evaluación. Si desea utilizar un algoritmo de optimización (o cálculo) para encontrar rápidamente la configuración de parámetros ideal que le brinda lo mejor, ¡lo más óptimo! — rendimiento, es bueno tener un conveniente función con la que trabajar. Y es difícil vencer al MSE por eso. Hay una buena razón por la que la primera derivada que te enseñan es x²: en cálculo, los cuadrados facilitan mucho las cosas. Lo siguiente que te enseñan en cálculo 101 es qué hacer con constantes y sumas, ya que también son muy fáciles. ¿Adivina qué? ¡Cuadrados, sumas y constantes (1/n) es la fórmula completa para MSE! Y esa, mis amigos, es la verdadera razón por la que MSE es tan popular. Pereza pragmática. Es literalmente la función vagamente sensible más fácil de los errores para optimizar. Y es por eso que fue el que Legendre y Gauss usaron a principios del siglo XIX para los primeros modelos de regresión… y por eso todavía nos encanta hoy. Pero, ¿es perfecto para todas sus necesidades? ¿Y supera a otras funciones de pérdida en todas las condiciones? Ciertamente no, especialmente cuando tiene una infestación de valores atípicos en sus datos. En la práctica, a menudo tendrá dos funciones con las que está trabajando: una función de pérdida y una separado métrica de evaluación del desempeño. Obtenga más información al respecto aquí. Ahora que conoce la razón por la que le gusta el MSE, también puede elegir otras funciones de pérdida si están disponibles para usted, especialmente si tiene muchos recursos informáticos y/o conjuntos de datos más pequeños. Si se divirtió aquí y está buscando un curso completo de IA aplicada diseñado para ser divertido tanto para principiantes como para expertos, aquí está el que hice para su diversión: Estos son algunos de mis tutoriales favoritos de 10 minutos:

Nota

* “Función de pérdida” es la palabra de aprendizaje automático para “función objetivo”: son lo mismo.

aliintizar71

Recent Posts

Máquina de mano Lean, Green, Raspberry Pi

Los días felices de la PDA y Blackberry han quedado definitivamente atrás, pero el factor…

1 year ago

Cómo pronosticar series de tiempo usando autorregresión

Tutorial sobre cómo pronosticar usando un modelo autorregresivo en PythonFoto de Aron Visuals en UnsplashForecasting…

1 year ago

Aquí están todas las formas en que puede cargar su AirPods Pro

Si tienes un iPhone, los AirPods Pro son la opción obvia para escuchar música, ¡aunque…

1 year ago

Las principales noticias tecnológicas del lunes: la prohibición de clientes de terceros de Twitter parece no ser un accidente

Ilustración de Alex Castro / The Verge Plus nuevos rumores sobre el quinto Galaxy Fold.…

1 year ago

AirPods Max 2: aquí están las características más solicitadas

Se rumorea que los auriculares premium de próxima generación de Apple, los AirPods Max 2,…

1 year ago

El remake de Dead Space continúa luciendo terriblemente genial en el nuevo tráiler de la historia

El desarrollador Motive Studio y el editor EA han lanzado un nuevo tráiler de la…

1 year ago