Wed. Sep 28th, 2022

Mantenga estos sencillos consejos a mano para ayudarlo a tener éxito como científico de datos

Foto de Михаил Павленко en UnsplashLo lograste. Te graduaste/completaste un bootcamp/terminaste un certificado/te enseñaste a ti mismo, y ahora, finalmente, te has convertido en un científico de datos. Después de muchos meses o años agotadores, puede llamarse oficialmente científico de datos y comenzar a postularse para trabajos de ciencia de datos. Su arduo trabajo y esfuerzo han valido la pena y ahora puede tomar esas habilidades y comenzar a tener un impacto en una empresa. Ahora, sin embargo, es hora de absorber un poco más de información. Su cerebro está repleto, pero esta comunidad de científicos de datos con años de experiencia tiene algo que quiere compartir con usted: consejos laborales de una sola oración para los nuevos graduados en ciencias de datos. Aquí encontrará 10 pequeños consejos para tener siempre en su bolsillo que lo ayudarán a tener éxito en su carrera como científico de datos. Cuando 500 nuevos científicos de datos solicitan el mismo puesto de nivel de entrada, ¿qué cree que establece uno? candidato exitoso aparte del resto? ¿Es su capacidad para pensar a través de análisis complejos? Quizás. ¿Es su capacidad para construir un modelo de aprendizaje automático más rápido que los demás? Tal vez. ¿Es su capacidad para tener la combinación correcta de habilidades duras que una empresa está buscando, así como habilidades blandas, lo que los convertirá en la persona adecuada para el equipo? De hecho, sí. Eso es exactamente lo que distingue a un científico de datos del resto del grupo. Al competir contra otros 500 candidatos para un puesto de ciencia de datos, se puede suponer que todos tendrán más o menos las habilidades duras adecuadas que una empresa está buscando, como como la codificación, las matemáticas y la capacidad de construir modelos de aprendizaje automático e inteligencia artificial. Sin embargo, lo que no todos tienen son habilidades interpersonales. La capacidad de trabajar como parte de un equipo, comunicarse, leer, escribir, comprender, resolver problemas, tomar decisiones críticas y administrar su tiempo sabiamente, son todas habilidades blandas que le permitirán obtener el trabajo. Estas habilidades son las que lo distinguen de todos los demás candidatos y lo convertirán en un activo valioso para una empresa. En la universidad, siempre tendrá un conjunto de datos apropiado para resolver el problema que se le ha asignado. En un bootcamp , conjuntos de datos agradables y limpios lo ayudarán a desarrollar sus habilidades. A través de sus propios proyectos personales, encontrará cientos de conjuntos de datos disponibles en línea que contienen miles de entradas completas que puede usar para desarrollar algunos proyectos bastante complejos. Sin embargo, cuando presiona el mundo real, te darás cuenta de que, la mayoría de las veces, los datos apestan. Ya sea que el conjunto de datos esté incompleto, sea demasiado pequeño o tenga demasiados valores atípicos para tomar una decisión concreta, los datos del mundo real suelen ser el quid de un análisis que se le ha encomendado completar. Y eso está bien. Los datos incorrectos son un hecho de la vida y solo se puede esperar que desarrolle un análisis tan preciso como pueda con lo que se le ha dado para trabajar. Resolver un problema utilizando la ciencia de datos en la escuela o en un bootcamp es una cosa. Allí, las personas para las que está “trabajando” tienen una gran comprensión de la ciencia de datos y los tipos de problemas que puede y no puede resolver dado un conjunto de datos en particular. Podrán brindarle problemas claros para trabajar y resolverlos que realmente tengan sentido. En el mundo real, es muy probable que algún ejecutivo de nivel C quiera que su equipo de ciencia de datos construya un modelo o desarrolle un análisis para resolver un problema que nadie entiende realmente. Parece haber algún tipo de problema para los que están en la mesa ejecutiva, pero nadie puede describirlo muy claramente cuál es el problema real. Este aspecto de trabajar en ciencia de datos se convertirá en una parte más del trabajo para usted con el tiempo en. Su trabajo es ayudar a esos ejecutivos a obtener una comprensión más clara de cuál creen que es el problema y explicarles cómo cree que podría resolverse. Llano y simple. No reinventes la rueda ni te rompas la espalda tratando de conjurar algo de la nada. Su trabajo es simplemente ayudarlos a comprender el uso de datos. Una “hoja de alardes” puede ser tan completa como las adiciones a su currículum o tan simple como una nota adhesiva pegada en la parte inferior de su monitor. En esencia, este debería ser el lugar donde haga una lista de los logros que acumuló a lo largo de su carrera. Tal vez desarrolló un modelo que encontró inexactitudes en las tácticas de informes de su empresa que les ayudó a descubrir cuáles eran realmente sus números. O tal vez encontró formas de retener la atención de un usuario del sitio web durante más tiempo y redujo la tasa de rebote del sitio web. O tal vez desarrolló un modelo de inteligencia artificial que aprendió cómo se veía una tendencia específica en el cáncer de piel que se usó para ayudar a los médicos a mejorar la precisión de sus diagnósticos en un 17 %. Cualquiera que sea su logro o el impacto generado en su empresa u organización, es importante para realizar un seguimiento de lo que ha hecho a lo largo de su carrera. Cuando recién comienza, esto lo ayudará a mantenerse motivado cuando los tiempos se pongan difíciles, y cuando tenga varios años de experiencia, lo ayudará a progresar durante el resto de su carrera. Lo único de los datos científicos es que necesitan ser capaces de explicar conceptos brutalmente técnicos en términos simples que cualquiera en una empresa pueda entender. Su mejor truco para lograr esto es desarrollar la capacidad de crear conexiones con conceptos usando una analogía. Las analogías son excelentes maneras de proporcionar una representación clara de una idea compleja de una manera que sea fácilmente digerible y comprensible desde el principio. Estas analogías deben ser relevantes para la empresa o industria en la que está trabajando y deben brindar suficiente información para que un ejecutivo de nivel C pueda confiar en tomar una decisión basada en su comprensión. Las analogías deben estar libres de la jerga de la ciencia de datos y lo suficientemente breves. para ser memorable. En mi experiencia, crear analogías con las que las personas puedan relacionarse es vital para su éxito al poder explicar lo que sucede dentro de una empresa utilizando datos. He usado analogías de deportes, analogías de cocina, analogías de animales y más para ayudar a las personas a comprender el concepto técnico que estoy tratando de decirles. Estas analogías no solo ayudarán a que las ideas se queden en la mente de las partes interesadas, sino que también serán herramientas que las partes interesadas pueden usar para difundir su información. Este acrónimo seguirá apareciendo, sin importar cuánto tiempo hace que lo aprendió cuando estudió ciencia de datos por primera vez. . Viniendo del mundo de la codificación, este acrónimo probablemente te ayudará a avanzar en tu carrera más que cualquier otro consejo. ¿Por qué hacer algo complicado cuando puedes mantenerlo simple? Claro, sería bueno impresionar a su jefe con algún modelo elaborado que limpie sus datos usando dos líneas de código. Pero, ¿no les impresionaría más si desarrollara un modelo que pudiera entenderse, actualizarse, integrarse y usarse fácilmente después de dejar la empresa? Puede comenzar su carrera pensando que la complejidad en su trabajo es la única manera de seguir siendo relevante para una compañía. Sin embargo, su capacidad para completar su trabajo a tiempo, de una manera simple, que cualquiera pueda usar y que produzca los resultados exactos que busca, es lo que lo mantendrá relevante. Además, su capacidad para seguir aprendiendo y aumentar su conjunto de habilidades es lo que también lo mantendrá como un miembro valioso del equipo. Si lo tuyo es la complejidad, solo asegúrate de consultar primero con tu jefe para ver si este es el proyecto adecuado para ti. hacer todo lo posible. De lo contrario, manténgalo simple, limpio y fácil de entender. Para ser justos, no es exactamente difícil impresionar a un ejecutivo de nivel C sin una amplia experiencia técnica. Es importante recordar que estas personas a menudo aprecian fácilmente cuando se reinicia algo tan simple como su módem. Sin embargo, llega un momento en el que es posible que desee ser más impresionante. Esta necesidad de impresionar también debe equilibrarse con el hecho de que el jefe del jefe aún pueda entender lo que hizo o lo que resolvió. Una vez más, como se mencionó anteriormente, esto puede implicar el desarrollo de un modelo complejo para resolver un problema difícil que aún puede resolverse. descrito usando términos simples. Quiere impresionar al jefe de su jefe, pero que aún así pueda entender el impacto que trajo a la empresa. En caso de duda, agregue color a un gráfico, pruebe con un histograma en lugar de un gráfico de barras y use palabras como “máquina”. aprendizaje” e “inteligencia artificial” para impresionar sin revelar demasiados detalles. Recuerde, podría decirse que el 90 % de la ciencia de datos es una regresión lineal simple, es posible que solo necesite disfrazarlo un poco. A los científicos de datos a menudo se les asignan tareas imposibles: completar un análisis de datos con datos inexistentes, desarrollar un modelo de aprendizaje automático que resuelva los problemas de la empresa, o integrar nuevos modelos en una base de código que no se ha tocado desde 2005. Muchos ven a los científicos de datos como expertos en todos los oficios (lo que somos) que pueden resolver cualquier problema de la empresa utilizando datos (que nosotros no podemos) . Esto significa que hay mucho en juego cuando se nos presenta un problema comercial y se nos pide que lo resuelvamos para el final de la semana. Desafortunadamente, no todos los problemas se pueden resolver colocando un vendaje de regresión lineal en la herida. Por lo tanto, a menudo es mejor errar por el lado de la precaución y ser conservador con lo que cree que se puede lograr con las herramientas que le dan y las condiciones. estás debajo No prometer lo suficiente lo salva cuando las cosas salen según lo planeado y cumplir demasiado lo hace ganarse el cariño de su jefe y del jefe de su jefe cuando las cosas salen inesperadamente bien.

“Solo tú y Dios pueden leer tu código y estás a una sesión de flujo de que sea solo Dios”. — TheDragonSpark, r/ciencia de datos

Escribir un código excelente no se trata de poder completar la mayor cantidad de trabajo con la menor cantidad de líneas. Se trata de poder leer y comprender el código que escribiste un viernes después de un largo fin de semana fuera. Se trata de poder darle su código a un pasante dentro de cinco años y que pueda entenderlo y optimizarlo. Se trata de poder dejar un legado en una empresa de código fácil de usar que no resulte en que un científico de datos descontento lo llame por teléfono a horas intempestivas para pedir ayuda. Vaya más allá de nombrar sus variables x , y y z . En su lugar, use nombres descriptivos que le digan exactamente qué contiene una variable y qué resultado debe producir cuando se combina con otra variable. Nombre sus funciones para describir exactamente lo que hacen. Use comentarios para aclarar cualquier línea, lógica o lugar confuso donde haya tenido para sumergirse en las profundidades de StackOverflow. Use el archivo READ.me para dar una idea clara de su proceso de pensamiento, el objetivo de su código y una idea de cómo y por qué debería funcionar. Ser diligente al nombrar con precisión sus variables y usar comentarios lo llevará sorprendentemente lejos en su carrera como científico de datos. La mayoría de los científicos de datos apestan escribiendo un buen código (en comparación con los ingenieros de software). La mayoría de los científicos de datos apestan en matemáticas (en comparación con los matemáticos). desarrolladores de aprendizaje). Esto es lo que hace que los científicos de datos sean únicos: tenemos las habilidades para cada una de estas especialidades y podemos llevarlas a cabo notablemente bien a pesar de que todos provienen de lugares muy diferentes. áreas ent. El síndrome del impostor es muy común en los científicos de datos, donde todos esperan que usted sea un ingeniero de software, matemático, desarrollador de aprendizaje automático, analista de negocios, diseñador gráfico, gerente de proyectos y más. Por lo tanto, es importante que te recuerdes que eres bueno en todas estas habilidades, pero que no es necesario ser un experto en cada una de ellas. Si la empresa quisiera un estadístico, habría contratado a un estadístico. En cambio, lo contrataron porque posee un conjunto de habilidades tan variado que lo convierte en el paquete completo, capaz de llevar a cabo cada una de las tareas enumeradas anteriormente, y algunas más.