df = pd.read_csv(“../input/titanic/train.csv”) En pocas palabras, la función de aplicación en pandas es una función de nivel variable donde puede aplicar varias transformaciones para transformar una variable. Aquí, puede utilizar la función lambda o la función personalizada que realice para crear la lógica de transformación que desea aplicar. Por ejemplo, si desea multiplicar por 100 en la variable “Tarifa” por algún motivo, puede ejecutar el siguiente código: df[‘Fare’] = gl[‘Fare’].apply(lambda x: x * 100) Con esta mente, puede realizar todo tipo de transformaciones geniales siempre que pueda crear sabiamente la lambda o la función personalizada con precisión de la forma que desee. El siguiente es un ejemplo de código que extrae información de mes y día de algunas cadenas de fechas con formato xxxx/mm/dd.[‘last_review_month’] = datos[‘last_review’].apply(lambda x: fechahora.fechahora.strphora(x, “%Y-%m-%d”).mes)datos[‘last_review_day’] = datos[‘last_review’].apply(lambda x: datetime.datetime.strptime(x, “%Y-%m-%d”).day)La función Applymap es la versión de todos los datos de apply donde la lógica de transformación se aplica en cada punto de datos en el datos (por ejemplo, cada celda en la vista de datos). Digamos que queremos cambiar todos los nombres de los pasajeros a minúsculas. Para fines de demostración, vamos a crear un marco de datos separado que sea un subconjunto del original con solo la variable “Nombre” en él.df_name = df.copy()[[‘Name’]]df_nombre.head()
Por último, pero no menos importante, la función Agregación, a diferencia de las funciones Aplicar y Aplicar mapa, devuelve un nuevo marco de datos que incluye las estadísticas de resumen agregadas que especifica el usuario. Las estadísticas de resumen agregadas se refieren a estadísticas que incluyen el valor máximo, el valor mínimo, la media, la mediana y la moda. Aquí, calculamos la edad promedio, la edad máxima y la tasa de supervivencia de los pasajeros.df.groupby(“Pclass”).agg(avg_age = (“Edad”, “media”),
max_age = (“Edad”, “max”),
Survival_rate = (“Sobrevivió”, “promedio”)) Como puede ver en el fragmento anterior, el uso de la función de agregación junto con la función Groupby se convierte en una herramienta poderosa para calcular agregaciones para diferentes grupos de puntos de datos. En este artículo, usó el conjunto de datos Titanic Disaster para ilustrar lo que hacen las tres funciones de transformación / transmisión más utilizadas y cómo se diferencian entre sí. Estén atentos a más de mis artículos sobre limpieza de datos, aprendizaje automático, aprendizaje profundo, procesamiento de lenguaje natural y más. Si esta publicación le resultó útil, considere apoyarme registrándose en medium a través del siguiente enlace:) joshnjuny.medium.com ¡Tenga acceso a tantos artículos y publicaciones útiles e interesantes no solo míos sino también de otros autores!Científico de datos. Estudiante de doctorado de primer año en Informática en UC Irvine. Ex especialista en el área de investigación en el laboratorio de economía del Sistema de registros administrativos de justicia penal (CJARS) en la Universidad de Michigan, trabajando en la generación de informes estadísticos, revisión automatizada de la calidad de los datos, construcción de canalizaciones de datos y estandarización de datos y armonización. Ex becario de ciencia de datos en Spotify. Inc. (NYC). Le encantan los deportes, hacer ejercicio, cocinar buena comida asiática, ver kdramas y hacer / tocar música y, lo que es más importante, adorar a Jesucristo, nuestro Señor. ¡Mira su sitio web!
Los días felices de la PDA y Blackberry han quedado definitivamente atrás, pero el factor…
Tutorial sobre cómo pronosticar usando un modelo autorregresivo en PythonFoto de Aron Visuals en UnsplashForecasting…
Si tienes un iPhone, los AirPods Pro son la opción obvia para escuchar música, ¡aunque…
Ilustración de Alex Castro / The Verge Plus nuevos rumores sobre el quinto Galaxy Fold.…
Se rumorea que los auriculares premium de próxima generación de Apple, los AirPods Max 2,…
El desarrollador Motive Studio y el editor EA han lanzado un nuevo tráiler de la…