Para comenzar, primero orientémonos antes de sumergirnos en los casos de uso comercial. Podemos usar la función de pérdida de cuantiles para problemas de regresión, que discutiré en este artículo. La regresión es un tipo de algoritmo que predice una variable continua. Por ejemplo, si quisiéramos predecir un valor que está en el rango de 0 a 100.
Estos son ejemplos de otras funciones de pérdida que a menudo se aplican a los algoritmos de regresión:
MAE optimiza para la mediana (valor absoluto medio) sin centrarse en la optimización direccional, de ahí la parte ‘absoluta’RMSE optimiza los valores atípicos (Root Mean Square Error): penaliza los errores más grandes. Por lo tanto, puede usar MAE si sus datos están distribuidos de manera más normal y no tienen valores atípicos, mientras que puede usar RMSE si tiene valores atípicos en sus datos y los errores grandes son especialmente dolorosos. para su caso de uso. Ahora que sabemos cómo son las funciones de pérdida típicas, podemos ver el cuantil.
Esto puede ser especialmente útil si su observación/recuento real se encuentra por encima de la mediana con más frecuencia.
Ahora profundicemos en la parte divertida: cuándo esta función es realmente útil para su negocio o también para cualquier caso de uso académico. Supongamos que tenemos el mismo ejemplo anterior de un rango de 0 a 100 observaciones reales. Si la mediana es 50, pero hay más valores reales por encima de 50, digamos de 60 a 80 que de 20 a 40, entonces deberíamos usar un valor alfa cuantil más alto. Puede probar diferentes alfas, pero le gustaría comenzar con cualquier cosa por encima de 0,50, o de lo contrario está anulando el propósito de la pérdida cuantil y en realidad está utilizando MAE en este caso.
Para llevar el punto más lejos, resumamos dos casos de uso simples que pueden representar prácticamente cualquier decisión que tomará con quantile:
Prediga el precio del avión para un viaje largo. Como puede ver, ya queremos penalizar las predicciones bajas, por lo que elegiremos un cuantil de predicción superior a 0.50+, podría comenzar con 0.55, 0.60, y así sucesivamente. Podría ser una buena idea seguir probando 0,50 como comparación de referencia. Es probable que su los datos están sesgados a la derecha, que debe verificar, y que es mejor predecir en exceso porque los precios en el pasado generalmente han estado más cerca del rango máximo que del rango mínimo. Por ejemplo, no esperaríamos que un vuelo largo costara $10 la mayoría de las veces (incluso con un mínimo observado de $10) y, en cambio, esperaríamos que estuviera más cerca de algo así como $200, por ejemplo. área en verano. Si estamos en una región más seca, en cualquier lugar, por ejemplo, y es verano, pero queremos predecir la lluvia para un día determinado, podemos esperar que nuestros datos reales sean bastante bajos en referencia a nuestro rango máximo, que contiene algunas tormentas eléctricas. En este caso, es posible que queramos usar un alfa de 0,45 o menos, etc., porque vemos que nuestro conteo de filas donde la lluvia es baja es más frecuente, por lo que queremos predecir menos lluvia.
Los días felices de la PDA y Blackberry han quedado definitivamente atrás, pero el factor…
Tutorial sobre cómo pronosticar usando un modelo autorregresivo en PythonFoto de Aron Visuals en UnsplashForecasting…
Si tienes un iPhone, los AirPods Pro son la opción obvia para escuchar música, ¡aunque…
Ilustración de Alex Castro / The Verge Plus nuevos rumores sobre el quinto Galaxy Fold.…
Se rumorea que los auriculares premium de próxima generación de Apple, los AirPods Max 2,…
El desarrollador Motive Studio y el editor EA han lanzado un nuevo tráiler de la…