Mon. Oct 3rd, 2022

Por qué necesita dominar esta habilidad y cómo hacerlo

Ada Bojana, Montenegro (Imagen del autor) Todos los aspirantes a científicos de datos con los que hablo piensan que su trabajo comienza cuando alguien más les proporciona: un conjunto de datos y una métrica claramente definida para optimizar, por ejemplo, precisión. Pero no es así. Comienza con un negocio. problema que necesita comprender, enmarcar y resolver. Esta es la habilidad clave de ciencia de datos que separa a los profesionales senior de los jóvenes. Y en este artículo, le mostraré cómo puede entrenar esta habilidad de ciencia de datos, con un ejemplo del mundo real. En el mundo real, los proyectos de ciencia de datos comienzan con un problema de negocios. Nacen para mover una métrica empresarial clave (KPI). El trabajo del científico de datos es traducir un problema empresarial en el *Correcto* problema de ciencia de datos. Luego, resuélvalo. Para convertir un problema de negocios en *el problema correcto* de ciencia de datos, debe hacer 2 cosas: hacer preguntas, explorar los datos para encontrar pistas.

No hay nada más frustrante que crear una gran solución de ciencia de datos para el problema comercial equivocado.

Vamos a lanzar un ejemplo. Imagina que eres un científico de datos en una de las principales empresas de aplicaciones para compartir viajes. Y su líder de producto le dice:

👩‍💼: “Queremos disminuir la rotación de usuarios en un 5 % este trimestre”

Decimos que un usuario abandona cuando decide dejar de usar nuestra aplicación de viajes compartidos. Hay diferentes razones detrás de la rotación de usuarios. Por ejemplo: “Otra empresa de aplicaciones de viajes compartidos (también conocido como competidor directo) está ofreciendo mejores precios para esa ubicación geográfica” (problema de precios) “Los tiempos de espera de los automóviles son demasiado largos” (problema de suministro) “La versión de Android de la aplicación es muy lenta” (problema de rendimiento de la aplicación cliente) Esta lista se crea ↑ haciendo las preguntas correctas al resto del equipo. Debe comprender la experiencia del usuario al usar la aplicación, desde SU punto de vista. Por lo general, no hay una sola razón detrás de la rotación, sino una combinación de algunas de ellas. La pregunta es: ¿en cuál debería enfocarse? Aquí es cuando saca sus grandes habilidades de ciencia de datos y EXPLORA LOS DATOS 🔎. Explora los datos para comprender qué tan plausible es cada una de las explicaciones anteriores. El resultado de este análisis es una sola hipótesis que debe considerar más a fondo. Según la hipótesis, resolverá el problema de la ciencia de datos de manera diferente. Por ejemplo: una solución sería detectar/predecir de alguna manera el segmento de usuarios que es probable que abandonen ( posiblemente usando un modelo ML) y envíe descuentos personalizados a través de notificaciones automáticas. Para probar que su solución funciona, deberá ejecutar una prueba A/B, por lo que dividirá un porcentaje de usuarios de la aplicación en 2 grupos: El grupo A. Ningún usuario de este grupo recibirá ningún descuento. El grupo B. Los usuarios de este grupo que el modelo cree que es probable que abandonen, recibirán un descuento en el precio en su próximo viaje. Puede agregar más grupos (por ejemplo, C, D, E…) para probar diferentes puntos de precios.Del problema de precios a una solución de ciencia de datos (Imagen del autor) En este caso, no hay un problema de precios, sino una falta de conductores para captar clientes. El problema es diferente, por lo que la solución también debe ser diferente. Algo que puede hacer es identificar el lugar y el momento en que el suministro es demasiado bajo y ofrecer un incentivo de precio para que los buzos cubran estos espacios. De esta manera, puede equilibrar mejor la oferta y la demanda y reducir los tiempos de espera de los automóviles.Del problema de suministro a una solución de ciencia de datos (Imagen del autor) Imagine que explora los datos sobre el consumo de memoria de la aplicación y descubre que la última versión de la aplicación consume casi el doble de memoria que las versiones anteriores.Desglose el consumo de memoria de la aplicación por versión de la aplicación (Imagen del autor) Esto es extraño, así que va y pregunta al equipo de atención al cliente si han recibido alguna queja de los usuarios. Resulta que la mayoría de los usuarios no se comunican con el soporte, sino que dejan de usar la aplicación y use una alternativa. Sin embargo, todavía hay algunos usuarios que se quejaron y mencionaron que la nueva versión de la aplicación no era “muy receptiva”. Bingo. Encontraste un problema en la versión más reciente de la aplicación. ¿Cómo lo solucionas? Diríjase a los desarrolladores frontend, muéstreles el desglose de la rotación de uso por versión de la aplicación y convénzalos de que deben lanzar una nueva versión de la aplicación con un mejor rendimiento.De un problema tecnológico a una solución de ciencia de datos (Imagen del autor) Traducir los problemas comerciales al problema de ciencia de datos “correcto” es la habilidad clave de ciencia de datos que separa a un científico de datos senior de uno junior. Haga las preguntas correctas, enumere posibles soluciones, y explore los datos para reducir la lista a uno. Resuelva este problema de ciencia de datos 🚀 Únase al boletín informativo de Datamachines para obtener un enfoque del mundo real de ML y Data Science.➡️ Conéctate en Gorjeo 🐦, LinkedIn 👔💎 Conviértase en miembro hoy usando mi enlace de referencia y obtén acceso ilimitado a todo el contenido que publico en Medium y apoya mi escritura. Feliz aprendizaje 🤗 Pau