Deje de usar MAE y use esta función de pérdida de ciencia de datos en su lugar

Opinión

Una mirada a la pérdida por cuantiles y cuándo usarla: casos de uso comercial

Foto de Joseph Yip en Unsplash [1].IntroducciónFunciones de pérdida y regresiónCuándo usar Quantile y WhenSummaryReferencesComo científico de datos que ha aprendido mucho en línea, he visto una falta de discusiones sobre las funciones de pérdida que no son MAE o RMSE. Por esta razón, voy a dar un resumen rápido de cuándo usar una función de pérdida diferente, que es la poderosa función de pérdida cuantil y sus variaciones. Esta discusión será útil para los científicos de datos que no han oído hablar tanto de esta función, además de aquellos que desean obtener más información sobre cuándo usar la función de pérdida cuantil. Dicho esto, veamos algunos de los qué, por qué y cuándo de los cuantiles, específicamente casos de uso comercial.

Funciones de regresión y pérdida

Para comenzar, primero orientémonos antes de sumergirnos en los casos de uso comercial. Podemos usar la función de pérdida de cuantiles para problemas de regresión, que discutiré en este artículo. La regresión es un tipo de algoritmo que predice una variable continua. Por ejemplo, si quisiéramos predecir un valor que está en el rango de 0 a 100.

Estos son ejemplos de otras funciones de pérdida que a menudo se aplican a los algoritmos de regresión:

MAE optimiza para la mediana (valor absoluto medio) sin centrarse en la optimización direccional, de ahí la parte ‘absoluta’RMSE optimiza los valores atípicos (Root Mean Square Error): penaliza los errores más grandes. Por lo tanto, puede usar MAE si sus datos están distribuidos de manera más normal y no tienen valores atípicos, mientras que puede usar RMSE si tiene valores atípicos en sus datos y los errores grandes son especialmente dolorosos. para su caso de uso. Ahora que sabemos cómo son las funciones de pérdida típicas, podemos ver el cuantil.Foto de Maxim Hopman en Unsplash [2].El término cuantil es otra forma de decir percentil pero en forma fraccionaria. Además, si el valor del cuantil es 0,80, por ejemplo, podemos decir que las predicciones bajas se penalizarán con un factor de 0,80. Mientras que, a la inversa, se puede decir sobre las predicciones excesivas, que se penalizarán con un factor de 0,20. Por lo tanto, las predicciones excesivas serán menos penalizadas que las predicciones insuficientes. En este caso, predeciríamos en exceso el 80% de las veces.

Esto puede ser especialmente útil si su observación/recuento real se encuentra por encima de la mediana con más frecuencia.

Ahora profundicemos en la parte divertida: cuándo esta función es realmente útil para su negocio o también para cualquier caso de uso académico. Supongamos que tenemos el mismo ejemplo anterior de un rango de 0 a 100 observaciones reales. Si la mediana es 50, pero hay más valores reales por encima de 50, digamos de 60 a 80 que de 20 a 40, entonces deberíamos usar un valor alfa cuantil más alto. Puede probar diferentes alfas, pero le gustaría comenzar con cualquier cosa por encima de 0,50, o de lo contrario está anulando el propósito de la pérdida cuantil y en realidad está utilizando MAE en este caso.

Para llevar el punto más lejos, resumamos dos casos de uso simples que pueden representar prácticamente cualquier decisión que tomará con quantile:

Prediga el precio del avión para un viaje largo. Como puede ver, ya queremos penalizar las predicciones bajas, por lo que elegiremos un cuantil de predicción superior a 0.50+, podría comenzar con 0.55, 0.60, y así sucesivamente. Podría ser una buena idea seguir probando 0,50 como comparación de referencia. Es probable que su los datos están sesgados a la derecha, que debe verificar, y que es mejor predecir en exceso porque los precios en el pasado generalmente han estado más cerca del rango máximo que del rango mínimo. Por ejemplo, no esperaríamos que un vuelo largo costara $10 la mayoría de las veces (incluso con un mínimo observado de $10) y, en cambio, esperaríamos que estuviera más cerca de algo así como $200, por ejemplo. área en verano. Si estamos en una región más seca, en cualquier lugar, por ejemplo, y es verano, pero queremos predecir la lluvia para un día determinado, podemos esperar que nuestros datos reales sean bastante bajos en referencia a nuestro rango máximo, que contiene algunas tormentas eléctricas. En este caso, es posible que queramos usar un alfa de 0,45 o menos, etc., porque vemos que nuestro conteo de filas donde la lluvia es baja es más frecuente, por lo que queremos predecir menos lluvia.Foto de Edward Howell en Unsplash [3]Como puede ver, no existe un enfoque único para las funciones de pérdida. Realmente depende de lo siguiente:* Datos* Distribución de esos datos* Caso de negocio* Y cómo afectarán las predicciones al negocio, ¿es mejor sobrepredecir o subestimar? A veces, incluso puede ser más sencillo si desea uno u otro independientemente, sin centrarse en el error en sí mismo, pero centrándose en ajustar predicciones más pequeñas o más grandes por cualquier motivo. Espero que haya encontrado mi artículo interesante y útil. No dude en comentar a continuación si está de acuerdo o en desacuerdo con el uso de una función de pérdida sobre la otra. ¿Por qué o por qué no? ¿Qué otras funciones de pérdida crees que deberían discutirse más? Ciertamente, estos pueden aclararse aún más, pero espero haber podido arrojar algo de luz sobre las funciones de pérdida de ciencia de datos y sus aplicaciones.No estoy afiliado a ninguna de estas empresas.No dude en consultar mi perfil, Matt Przybyla, y otros artículos, así como suscribirse para recibir notificaciones por correo electrónico de mis blogs siguiendo el enlace a continuación, o por haciendo clic en el icono de suscripción en la parte superior de la pantalla junto al icono de seguimientoy comuníquese conmigo en LinkedIn si tiene alguna pregunta o comentario.Enlace de suscripción: https://datascience2.medium.com/subscribeEnlace de referencia: https://datascience2.medium.com/membership(Recibiré una comisión si te registras para obtener una membresía en Medium)[1] Foto de Joseph Yip en Unsplash, (2021)[2] Foto de Maxim Hopman en Unsplash, (2021)[3] Foto de Edward Howell en Unsplash, (2020)

aliintizar71

Next Una mirada a 4 sorprendentes casos de uso de IoT »

Previous « Este Arduino gigante realmente funciona... Más o menos

Published by

aliintizar71

2 years ago

Las principales noticias tecnológicas del lunes: la prohibición de clientes de terceros de Twitter parece no ser un accidente

Ilustración de Alex Castro / The Verge Plus nuevos rumores sobre el quinto Galaxy Fold.…

1 year ago

AirPods Max 2: aquí están las características más solicitadas

Se rumorea que los auriculares premium de próxima generación de Apple, los AirPods Max 2,…

1 year ago

El remake de Dead Space continúa luciendo terriblemente genial en el nuevo tráiler de la historia

El desarrollador Motive Studio y el editor EA han lanzado un nuevo tráiler de la…

1 year ago

TecNoticias, tu portal de información