– nombres de tablas, nombres de columnas, subcampos anidados
– uniones de mesa
– funciones Resaltado y formateo de sintaxis SQLMúltiples salidas de pantalla
– html y texto sin formato
– cuadrícula de datos interactiva y árbol json
– captura de marco de datos y vistasjupyterlab-sql-editor amplía JupyterLab con formato SQL y resaltado de sintaxis.
df = chispa.sql(sentencia)
df.show() Como puede ver, no es realmente mágico. La magia de sparksql toma el cuerpo de una celda como declaración, la ejecuta e imprime los resultados. La extensión simplemente encapsula el código Python repetitivo y lo hace fácilmente disponible a través de las opciones de la línea de comandos. Jupyterlab-sql-editor admite un amplio conjunto de formatos de salida, como una cuadrícula de datos interactiva. Usamos el ipydatagrid de Bloomberg que puede posprocesar (ordenar, filtrar y buscar) los resultados devueltos por la consulta de Spark.
CREAR TABLA prod.db.sample (
id bigint COMENTARIO ‘identificación única’,
cadena de datos)
UTILIZANDO iceberg%% chispasql
ALTER TABLE prod.db.muestra
AGREGAR COLUMNAS (
new_column cadena comentario ‘new_column docs’
)Usar la línea mágica %sparksql para declaraciones simples de una sola línea%sparksql SET chispa.sql.variable.substitute=false
%sparksql DROP TABLE prod.db.muestra
%sparksql CALL prod.system.set_current_snapshot(‘db.sample’, 1)Expresiones de tabla comunes (CTE) es una forma estándar de dividir declaraciones SQL grandes en partes más manejables. Jupyterlab-sql-editor no solo es compatible con CTE, sino que también le permite capturar o alias de declaraciones SQL como vistas que luego se pueden reutilizar en celdas posteriores. Este mecanismo aprovecha el marco de datos de Spark createOrReplaceTempView función. Utilizar el –vista opción para crear una vista temporal. Para evitar la ejecución inmediata de la consulta, utilice el –saltar salida opción. Cuando se utiliza esta opción, solo se crea la vista.
df.createOrReplaceTempView(‘my_csv_table’) Luego consulte la vista que creó en %% chispasql%% chispasql
SELECCIONE * DE my_csv_tableRecuerde actualizar su caché local ejecutando %%sparksql –actualizar local ¡y disfrute del autocompletador! jupyterlab-sql-editor tiene dos dependencias principales. jupyterlab-lsp y sql-language-server. Instalar la extensión es muy fácil.pip install jupyterlab-lsp jupyterlab-sql-editorInstale el proyecto sql-language-server para proporcionar autocompletado.sudo npm install -g sql-language-serverPara obtener una lista completa de las opciones de configuración, consulte la guía de instalación detallada. En este artículo mostramos cómo aprovechar %% chispasql para escribir fácilmente análisis componibles en Spark SQL. Nos enfocamos en Spark, sin embargo, jupyterlab-sql-editor también incluye un %%trino ¡magia! Es posible que se agreguen más motores SQL en el futuro. ¡Las contribuciones son bienvenidas! Aquí está nuestro repositorio git CybercentreCanada/jupyterlab-sql-editor. En un artículo de seguimiento, cubriremos el soporte de jupyterlab-sql-editor para plantillas SQL usando Jinja y DBT. A los contribuyentes de estos proyectos: krassowski/jupyterlab-lsp
joe-re/sql-language-server
zeroturnaround/sql-formateador
cryeo/sparksql-magia
bloomberg/ipydatagrid
Los días felices de la PDA y Blackberry han quedado definitivamente atrás, pero el factor…
Tutorial sobre cómo pronosticar usando un modelo autorregresivo en PythonFoto de Aron Visuals en UnsplashForecasting…
Si tienes un iPhone, los AirPods Pro son la opción obvia para escuchar música, ¡aunque…
Ilustración de Alex Castro / The Verge Plus nuevos rumores sobre el quinto Galaxy Fold.…
Se rumorea que los auriculares premium de próxima generación de Apple, los AirPods Max 2,…
El desarrollador Motive Studio y el editor EA han lanzado un nuevo tráiler de la…