Wed. Sep 28th, 2022

Ciencia de los datos

Foto de Nick Fewings en UnsplashSiempre pensé que quería ser científico de datos. Había leído sobre el glamour que trae esta profesión. Uno tiene la capacidad de cambiar los resultados comerciales con la ayuda de datos y decisiones basadas en datos. Además de eso, a uno le pagan una buena cantidad de dinero y, a menudo, sorprende a muchos miembros de la familia cuando les cuentan sobre su trabajo, porque es posible que sus amigos y familiares no tengan idea de lo que hace. Todo esto parecía muy prometedor. Entonces, para continuar en esa dirección, obtuve una Licenciatura en Estadística (H) de una de las facultades más influyentes de la Universidad de Delhi. Para complementar aún más mis conocimientos y obtener comprensión empresarial, obtuve la admisión a un título de posgrado que giraba en torno a los negocios y el espíritu empresarial. Me sentí más preparado que nunca para emprender una carrera en ciencia de datos. Después de ser científico de datos durante aproximadamente 4,5 años y trabajar con instituciones académicas y de investigación de primer nivel en una variedad de proyectos, renuncio hoy. En este artículo, explico las siete razones por las cuales.

¡Maestro de todos los oficios, gato de ninguno!

Es posible que todos hayan oído hablar de Jack of All Trades, Master of None. En mi caso, siempre fue al revés. Se espera que muchos científicos de datos, incluyéndome a mí, seamos expertos en aprendizaje automático, aprendizaje profundo, web scraping, ingeniería de bases de datos, implementación de modelos de aprendizaje automático a nivel de producción, ingeniería de software, política de datos y gobernanza. Hablando de herramientas, algunos de mis trabajos anteriores los empleadores querían que supiera Python, R, Java, Javascript, Hadoop, Spark, Tableau, Power BI, Excel, Scala, Jira y SAS. No pude estar a la altura de sus expectativas de saberlo todo. Muchas veces se espera que los científicos de datos respondan todo tipo de preguntas aleatorias sobre datos que se les presenten, porque si se les llama “científicos de datos”, deben saber todo sobre los datos. Lamentablemente, no es cierto.La solución a este problema es articular claramente en la descripción del trabajo la pila de tecnología que usa una organización, en lugar de escribir todo lo que está bajo el universo o todo lo que la organización cree que usará.

Infraestructura de datos nula o inadecuada

El trabajo de un científico de datos es impulsar la toma de decisiones utilizando datos. El requisito previo es que debe haber datos que puedan analizarse y actuar en consecuencia. He sido parte de organizaciones y proyectos, donde no había datos, y en el peor de los casos, no había infraestructura para capturar, almacenar y extraer datos cuando se necesitaban para tomar decisiones. La forma en que se capturan los datos en estos lugares fue principalmente en Google Drive o Sharepoint, y después de un tiempo, nadie sabe qué datos están, dónde y cómo se almacenan. Me identifico con Andrew Ng cuando dice que tener buenos datos es más importante que tener buenos modelos. Otro aspecto que se ve es que muchas veces los líderes empresariales no tienen una visión de datos para sus organizaciones, y la mayoría de las veces las acciones se reflejan de manera ad-hoc.La solución a este problema es contar con alfabetización de datos y desarrollar sistemas que puedan capturar y extraer datos cuando sea necesario. Estas son las responsabilidades laborales de un arquitecto de datos o un ingeniero de bases de datos.

Expectativas vs Realidad de ser un Científico de Datos

Uno de los mayores desafíos para muchos científicos de datos (¡y para mí también!) es que existe una gran diferencia entre las expectativas del puesto y lo que realmente haces. Muchas veces, los científicos de datos esperan obtener datos bien elaborados, los utilizarán para crear modelos y los líderes empresariales utilizarán estos modelos para tomar decisiones. Desafortunadamente, no es así como funcionan las cosas en la vida real. Muchas organizaciones, como se mencionó anteriormente, ni siquiera cuentan con la infraestructura de informes de datos. Por lo tanto, alrededor del 80 % de las veces se solicita a un científico de datos que obtenga los datos, los limpie, los transforme y luego los envíe al siguiente equipo. Esto crea desilusión en la mente de los científicos de datos. En el peor de los casos, se les pide a los científicos de datos que realicen tareas de datos serviles, como descargar datos o realizar análisis en Excel. Cuando estos científicos de datos desilusionados intentan encontrar otro trabajo, no consiguen otro fácilmente, ya que el futuro empleador no puede para ver claramente los logros en sus funciones anteriores. La mayoría de los empleadores buscan personas que puedan crear modelos y luego hacer que realicen limpieza y transformaciones de datos o informes comerciales ad-hoc.La solución a esto es crear una coincidencia entre expectativas y realidad con los posibles candidatos. Esto es útil no solo para el candidato, sino también para el empleador.

Agentes de servicio al cliente

Me cansé de ser tratado siempre como un representante de servicio al cliente donde recibía solicitudes de todos los departamentos de la organización porque yo era el tipo de “datos”. En muchas organizaciones, especialmente aquellas que no están impulsadas por productos basados ​​en el aprendizaje automático, los analistas de datos y los científicos de datos son tratados como personal de apoyo, que son necesarios para respaldar las cosas importantes más “dirigidas por la investigación” que hacen las organizaciones. No es es poco común recibir solicitudes como, “Hola Aayush, ¿puedes descargar este conjunto de datos para mí, hacer un análisis exploratorio rápido, hacer algunas diapositivas y compartirlas conmigo antes de las 8 de la mañana siguiente porque necesitamos compartirlas con algunos financiadores la próxima semana?” o “Hola Aayush, me encontré con este hermoso trabajo de investigación que utiliza el aprendizaje automático. ¿Puedes leer este papel y decirme qué hay allí?”.La solución a este problema es tener respeto por las tareas y deberes de cada persona, y no considerarlas como productos de usar y tirar en una organización.

Aislamiento y Monotonía

En mi caso, yo era en su mayoría la única persona en el equipo de datos (a veces en toda la organización), lo que llevó a que mi trabajo fuera aislado. El entorno de trabajo remoto exacerbó eso aún más. Como se explicó anteriormente, la mayoría de las solicitudes anteriores eran ad-hoc, lo que significaba que trabajaba solo y hacía las mismas actividades una y otra vez. Mi personalidad no estaba sincronizada con esto, ya que soy una persona a la que le encanta trabajar con colegas y en una variedad de tareas. Todo el ciclo de producción del aprendizaje automático parecía y resultó ser mentalmente agotador y monótono para mí. Y con toda la monotonía que se lleva a cabo, las decisiones no fueron asumidas por la dirección, pues tenían en mente otras prioridades.La solución a este problema es estructurar equipos con un conjunto diverso de personas. Además, despejar las dudas del candidato y explicarle previamente los periodos de aislamiento también será de gran ayuda.

Falta de orientación de científicos de datos sénior y expertos en dominios

Muchos líderes sénior tienen conocimientos limitados sobre los matices del problema en cuestión y cómo la ciencia de datos puede ser útil para resolverlos. Tienen ideas elevadas y luego solicitan y esperan que los científicos de datos operen con total eficiencia dentro de estas pautas indefinidas y objetivos vagos. Esto tiene el potencial de hacer que los científicos de datos no adopten el enfoque más lógico y estructurado para la resolución de problemas, sino más bien un método de prueba para encontrar soluciones. Este enfoque no es bueno para las finanzas de la organización ni para las operaciones. eficiencia. Además de esto, esto tampoco es muy útil para los científicos de datos que operan en este entorno. Además, no hay muchos científicos de datos senior disponibles que puedan ayudar a los científicos de datos junior en su crecimiento profesional y técnico.La solución a esto es capacitar a los científicos de datos en el conocimiento del dominio, escuchar sus argumentos respaldados por datos y planificar el crecimiento profesional para ellos en la organización. Muchos millennials no se mueven por salarios altos, sino por un alto crecimiento en su vida profesional y personal.

Política

En mis roles anteriores, me habían pedido que hiciera pequeños favores a mis colegas para que supieran y entendieran que ahora soy un científico de datos en la organización. Este tipo de comportamiento sin propósito para complacer a la gente no era muy alentador para mí. Además, muchas veces ni siquiera tuve acceso a los datos que tenían otros departamentos porque los encargados de esos departamentos no querían que los datos salieran a la luz. fue útil para que los colegas presentaran su agenda. Como científico de datos, no estaba capacitado para manejar esto. Esta es también una preocupación que muchos futuros científicos de datos enfrentarán en el trabajo.La solución a esto es aceptar las formas de las organizaciones y ascender en ese sistema (¡a menudo, lo más fácil!) o, si es lo suficientemente apasionado, expresar sus opiniones y sugerir formas prácticas y tangibles de cambiarlas en las empresas. Sin embargo, es posible que no siempre funcione.

Conclusión

Las razones anteriores son de mi experiencia personal y no todos pueden tener este tipo de situaciones en el trabajo. Tengo la intención de llevar adelante estas lecciones cuando me embarque en mi próximo viaje. Los conocimientos y experiencias que obtuve trabajando como científico de datos me enseñaron que los tipos de roles para los que soy más adecuado deben incluir trabajar con un equipo de manera colaborativa, realizar un conjunto diverso de actividades y ser la voz de los usuarios para sus éxito. Mi educación y experiencia me dieron habilidades analíticas relevantes que son útiles en muchas organizaciones. Con la mentalidad analítica adecuada y las habilidades para resolver problemas, espero poder ayudar a las organizaciones a tomar las decisiones estratégicas correctas. A medida que progrese más en mi carrera, seré más un científico de decisiones aplicadas que un analista de datos. Para cualquier pregunta o detalle, puede ponerse en contacto conmigo y podemos hablar más sobre sus experiencias. Nunca es emocionante tomar decisiones equivocadas y espero que con mi experiencia, usted estará en una mejor posición para decidir si desea continuar en la dirección de las ciencias de datos.