bamboolib

Artículo
08/28/2024

Importante

Esta característica está en versión preliminar pública.

Nota:

bamboolib se admite en Databricks Runtime 11.3 LTS y versiones posteriores.

bamboolib es un componente de interfaz de usuario que permite el análisis y las transformaciones de datos sin código desde un cuaderno de Azure Databricks. bamboolib ayuda a los usuarios a trabajar con más facilidad con sus datos, y acelera las tareas comunes de limpieza y transformación, exploración y visualización de datos. A medida que los usuarios completan estos tipos de tareas con sus datos, bamboolib genera automáticamente código de Python en segundo plano. Los usuarios pueden compartir este código con otros usuarios, quienes pueden ejecutar este código en sus propios cuadernos para reproducir rápidamente esas tareas originales. También pueden usar bamboolib para ampliar esas tareas originales con tareas de datos adicionales, todo ello sin necesidad de saber cómo programar. Quienes tienen experiencia en la programación pueden ampliar este código para crear resultados aún más sofisticados.

En segundo plano, bamboolib usa ipywidgets, que es un marco de widgets HTML interactivo para el kernel de IPython. ipywidgets se ejecuta dentro del kernel de IPython.

Requisitos

Un cuaderno de Azure Databricks, que esté asociado a un clúster de Azure Databricks con Databricks Runtime 11.0 o posterior.
La biblioteca bamboolib tiene que estar disponible para el cuaderno.
- Para instalar la biblioteca solo desde PyPI en un clúster específico, consulte Bibliotecas de clústeres.
- Para usar el comando %pip para que la biblioteca solo esté disponible para un cuaderno específico, consulte bibliotecas de Python con ámbito de cuaderno.

Inicio rápido

Cree un cuaderno de Python.
Asocie el cuaderno a un clúster que cumpla los requisitos.
En la primera celda del cuaderno, escriba el código siguiente y, luego, ejecute la celda. Este paso se puede omitir si bamboolib ya está instalado en el área de trabajo o el clúster.
```
%pip install bamboolib
```
En la segunda celda del cuaderno, escriba el código siguiente y, luego, ejecute la celda.
```
import bamboolib as bam
```
En la tercera celda del cuaderno, escriba el código siguiente y ejecute la celda.
```
bam
```
Nota:

Como alternativa, puede imprimir un DataFrame de Pandas existente para mostrar bamboolib para usar con ese DataFrame específico.
Continúe con las tareas clave.

Tutoriales

Puede usar bamboolib por sí mismo o con un DataFrame de Pandas existente.

Uso de bamboolib por sí mismo

En este tutorial, usará bamboolib para mostrar en el cuaderno el contenido de un conjunto de datos de ventas de ejemplo. Luego experimentará con parte del código del cuaderno relacionado que bamboolib genera automáticamente. Para finalizar, consultará y ordenará una copia del contenido del conjunto de datos de ventas.

Cree un cuaderno de Python.
Asocie el cuaderno a un clúster que cumpla los requisitos.
En la primera celda del cuaderno, escriba el código siguiente y, luego, ejecute la celda. Este paso se puede omitir si bamboolib ya está instalado en el área de trabajo o el clúster.
```
%pip install bamboolib
```
En la segunda celda del cuaderno, escriba el código siguiente y, luego, ejecute la celda.
```
import bamboolib as bam
```
En la tercera celda del cuaderno, escriba el código siguiente y ejecute la celda.
```
bam
```
Haga clic en Load dummy data.
En el panel Load dummy data, en Load a dummy data set for testing bamboolib, seleccione Sales dataset.
Haga clic en Ejecutar.
Muestra todas las filas donde item_type es Baby Food:
1. En la lista Search actions, seleccione Filter rows.
2. En el panel Filter rows, en la lista Choose (encima de where), seleccione Select rows.
3. En la lista debajo de where, seleccione item_type.
4. En la lista Choose junto a item_type, seleccione has value(s).
5. En el cuadro Choose value(s) junto a hgas value(s), seleccione Baby Food.
6. Haga clic en Ejecutar.
Copie el código de Python generado automáticamente para esta consulta:
1. Haga clic en Copiar código debajo de la vista previa de los datos.
Pegue el código y modifíquelo:
1. En la cuarta celda del cuaderno, pegue el código que ha copiado. Debería ser parecido a este:
```
import pandas as pd
df = pd.read_csv(bam.sales_csv)
# Step: Keep rows where item_type is one of: Baby Food
df = df.loc[df['item_type'].isin(['Baby Food'])]
```
2. Escriba código adicional de modo que muestre solo las filas en las que order_prio sea C y, luego, ejecute la celda:
```
import pandas as pd
df = pd.read_csv(bam.sales_csv)
# Step: Keep rows where item_type is one of: Baby Food
df = df.loc[df['item_type'].isin(['Baby Food'])]

# Add the following code.
# Step: Keep rows where order_prio is one of: C
df = df.loc[df['order_prio'].isin(['C'])]
df
```
Sugerencia

En lugar de escribir este código, también puede hacer lo mismo usando bamboolib en la tercera celda para mostrar solo las filas donde order_prio sea C. Este paso es un ejemplo de extensión del código que bamboolib generó automáticamente antes.
Ordene las filas por region en orden ascendente:
1. En el widget de la cuarta celda, en la lista Acciones de búsqueda, seleccione Ordenar filas.
2. En el panel Sort column(s), en la lista Choose column, seleccione region.
3. En la lista situada junto a region, seleccione ascending (A-Z).
4. Haga clic en Ejecutar.
Nota:

Esto equivale a escribir el código siguiente usted mismo:
```
df = df.sort_values(by=['region'], ascending=[True])
df
```
También podría haber usado bamboolib en la tercera celda para ordenar las filas por región en orden ascendente. En este paso se muestra cómo puede usar bamboolib para ampliar el código que escribe. A medida que usa bamboolib, se genera automáticamente el código adicional en segundo plano, para que pueda ampliar aún más el código ya extendido.
Continúe con las tareas clave.

Uso de bamboolib con un DataFrame existente

En este tutorial, usará bamboolib para mostrar en el cuaderno el contenido de un DataFrame de Pandas. Este DataFrame contiene una copia de un conjunto de datos de ventas de ejemplo. Luego experimentará con parte del código del cuaderno relacionado que bamboolib genera automáticamente. Para finalizar, consultará y ordenará parte del contenido del DataFrame.

Cree un cuaderno de Python.
Asocie el cuaderno a un clúster que cumpla los requisitos.
En la primera celda del cuaderno, escriba el código siguiente y, luego, ejecute la celda. Este paso se puede omitir si bamboolib ya está instalado en el área de trabajo o el clúster.
```
%pip install bamboolib
```
En la segunda celda del cuaderno, escriba el código siguiente y, luego, ejecute la celda.
```
import bamboolib as bam
```
En la tercera celda del cuaderno, escriba el código siguiente y ejecute la celda.
```
import pandas as pd

df = pd.read_csv(bam.sales_csv)
df
```
Tenga en cuenta que bamboolib solo admite DataFrames de Pandas. Para convertir un DataFrame de PySpark en un DataFrame de Pandas, llame a toPandas en el DataFrame de PySpark. Para convertir una API de Pandas de un DataFrame de Spark en un DataFrame de Pandas, llame a to_pandas en la API de Pandas del DataFrame de Spark.
Haga clic en Show bamboolib UI.
Muestra todas las filas donde item_type es Baby Food:
1. En la lista Search actions, seleccione Filter rows.
2. En el panel Filter rows, en la lista Choose (encima de where), seleccione Select rows.
3. En la lista debajo de where, seleccione item_type.
4. En la lista Choose junto a item_type, seleccione has value(s).
5. En el cuadro Choose value(s) junto a hgas value(s), seleccione Baby Food.
6. Haga clic en Ejecutar.
Copie el código de Python generado automáticamente para esta consulta. Para ello, haga clic en Copiar código debajo de la vista previa de los datos.
Pegue el código y modifíquelo:
1. En la cuarta celda del cuaderno, pegue el código que ha copiado. Debería ser parecido a este:
```
# Step: Keep rows where item_type is one of: Baby Food
df = df.loc[df['item_type'].isin(['Baby Food'])]
```
2. Escriba código adicional de modo que muestre solo las filas en las que order_prio sea C y, luego, ejecute la celda:
```
# Step: Keep rows where item_type is one of: Baby Food
df = df.loc[df['item_type'].isin(['Baby Food'])]

# Add the following code.
# Step: Keep rows where order_prio is one of: C
df = df.loc[df['order_prio'].isin(['C'])]
df
```
Sugerencia

En lugar de escribir este código, también puede hacer lo mismo usando bamboolib en la tercera celda para mostrar solo las filas donde order_prio sea C. Este paso es un ejemplo de extensión del código que bamboolib generó automáticamente antes.
Ordene las filas por region en orden ascendente:

a. En el widget de la cuarta celda, haga clic en Ordenar filas.
1. En el panel Sort column(s), en la lista Choose column, seleccione region.
2. En la lista situada junto a region, seleccione ascending (A-Z).
3. Haga clic en Ejecutar.
Nota:

Esto equivale a escribir el código siguiente usted mismo:
```
df = df.sort_values(by=['region'], ascending=[True])
df
```
También podría haber usado bamboolib en la tercera celda para ordenar las filas por región en orden ascendente. En este paso se muestra cómo puede usar bamboolib para ampliar el código que escribe. A medida que usa bamboolib, se genera automáticamente el código adicional en segundo plano, para que pueda ampliar aún más el código ya extendido.
Continúe con las tareas clave.

Tareas clave

En esta sección:

Adición del widget a una celda
Borrado del widget
Tareas de carga de datos
Tareas de acciones con datos
Tareas del historial acciones con datos
Obtención del código para volver a crear mediante programación el estado actual del widget como DataFrame

Escenario: Quiere que el widget de bamboolib se muestre en una celda.

Asegúrese de que el cuaderno cumpla los requisitos de bamboolib.
Si bamboolib aún no está instalado en el área de trabajo o el clúster, ejecute el código siguiente en una celda del cuaderno, preferiblemente en la primera celda:
```
%pip install bamboolib
```
Ejecute el código siguiente en el cuaderno, de preferencia en la primera o en la segunda celda del cuaderno:
```
import bamboolib as bam
```
Opción 1: En la celda donde quiere que aparezca el widget, agregue el código siguiente y, luego, ejecute la celda:
```
bam
```
El widget aparece en la celda debajo del código.

O:

Opción 2: En una celda que contenga una referencia a un DataFrame de Pandas, imprima el DataFrame. Por ejemplo, dada la siguiente definición de DataFrame, ejecute la celda:
```
import pandas as pd
from datetime import datetime, date

df = pd.DataFrame({
  'a': [ 1, 2, 3 ],
  'b': [ 2., 3., 4. ],
  'c': [ 'string1', 'string2', 'string3' ],
  'd': [ date(2000, 1, 1), date(2000, 2, 1), date(2000, 3, 1) ],
  'e': [ datetime(2000, 1, 1, 12, 0), datetime(2000, 1, 2, 12, 0), datetime(2000, 1, 3, 12, 0) ]
})

df
```
El widget aparece en la celda debajo del código.

Tenga en cuenta que bamboolib solo admite DataFrames de Pandas. Para convertir un DataFrame de PySpark en un DataFrame de Pandas, llame a toPandas en el DataFrame de PySpark. Para convertir una API de Pandas de un DataFrame de Spark en un DataFrame de Pandas, llame a to_pandas en la API de Pandas del DataFrame de Spark.

Escenario: Quiere borrar el contenido de un widget y, luego, leer nuevos datos en el widget existente.

Opción 1: Ejecute el código siguiente dentro de la celda que contiene el widget de destino:

bam

El widget se borra y luego vuelve a mostrar los botones Databricks: Read CSV file from DBFS, Databricks: Load database table y Load dummy data.

Nota:

Si aparece el error name 'bam' is not defined, ejecute el código siguiente en el cuaderno (de preferencia en la primera celda del cuaderno) y vuelva a intentarlo:

import bamboolib as bam

Opción 2: En una celda que contenga una referencia a un DataFrame de Pandas, vuelva a ejecutar la celda para imprimir el DataFrame. El widget se borra y, luego, muestra los nuevos datos.

Tareas de carga de datos

En esta sección:

Lectura del contenido de un conjunto de datos de ejemplo en el widget
Lectura del contenido de un archivo CSV en el widget
Lectura del contenido de una tabla de base de datos en el widget

Escenario: Quiere leer algunos datos de ejemplo en el widget, por ejemplo, algunos datos de supuestas ventas, para que pueda probar la funcionalidad del widget.

Haga clic en Load dummy data.

Nota:

Si Load dummy data no está visible, borre el widget con la opción 1 e inténtelo de nuevo.
En el panel Load dummy data, en Load a dummy data set for testing bamboolib, seleccione el nombre del conjunto de datos que quiere cargar.
En Dataframe name, escriba un nombre para el identificador de programación del contenido de la tabla, como DataFrame, o deje df como identificador de programación predeterminado.
Haga clic en Ejecutar.

El widget muestra el contenido del conjunto de datos.

Sugerencia

Puede cambiar el widget actual para mostrar el contenido de un conjunto de datos de ejemplo diferente:

En el widget actual, haga clic en la pestaña Load dummy data.
Siga los pasos anteriores para leer el contenido del otro conjunto de datos de ejemplo en el widget.

Escenario: Quiere leer el contenido de un archivo CSV dentro del área de trabajo de Azure Databricks en el widget.

Haga clic en Databricks: Read CSV file from DBFS.

Nota:

Si Databricks: Read CSV file from DBFS no está visible, borre el widget con la opción 1 e inténtelo de nuevo.
En el panel Read CSV from DBFS, vaya a la ubicación que contiene el archivo CSV de destino.
Seleccione el archivo CSV de destino.
En Dataframe name, escriba un nombre para el identificador de programación del contenido del archivo CSV, como DataFrame, o deje df como identificador de programación predeterminado.
En CSV value separator, escriba el carácter que separa los valores del archivo CSV o deje el carácter , (coma) como separador de valores predeterminado.
En Decimal separator, escriba el carácter que separa los decimales del archivo CSV o deje el carácter o (punto) como separador de valores predeterminado.
En Row limit: read the first N rows - leave empty for no limit, escriba el número máximo de filas que se van a leer en el widget, o deje 100000 como número predeterminado de filas, o bien deje este cuadro vacío para no especificar ningún límite de filas.
Haga clic en Open CSV file.

El widget muestra el contenido del archivo CSV, en función de la configuración especificada.

Sugerencia

Puede cambiar el widget actual para mostrar el contenido de otro archivo CSV:

En el widget actual, haga clic en la pestaña Read CSV from DBFS.
Siga los pasos anteriores para leer el contenido del otro archivo CSV en el widget.

Escenario: Quiere leer el contenido de una tabla de base de datos dentro del área de trabajo de Azure Databricks en el widget.

Haga clic en Databricks: Load database table.

Nota:

Si Databricks: Load database table no está visible, borre el widget con la opción 1 e inténtelo de nuevo.
En el panel Databricks: Load database table, en Database - leave empty for default database, escriba el nombre de la base de datos en la que se encuentra la tabla de destino, o deje este cuadro vacío para especificar la base de datos predeterminada.
En Table, escriba el nombre de la tabla de destino.
En Row limit: read the first N rows - leave empty for no limit, escriba el número máximo de filas que se van a leer en el widget, o deje 100000 como número predeterminado de filas, o bien deje este cuadro vacío para no especificar ningún límite de filas.
En Dataframe name, escriba un nombre para el identificador de programación del contenido de la tabla, como DataFrame, o deje df como identificador de programación predeterminado.
Haga clic en Ejecutar.

El widget muestra el contenido de la tabla, en función de la configuración especificada.

Sugerencia

Puede cambiar el widget actual para mostrar el contenido de otra tabla:

En el widget actual, haga clic en la pestaña Databricks: Load database table.
Siga los pasos anteriores para leer el contenido de la otra tabla en el widget.

Tareas de acciones con datos

bamboolib ofrece más de 50 acciones con los datos. A continuación se muestran algunas de las tareas básicas y más comunes de acción con los datos.

En esta sección:

Select columns
Quitar columnas
Filtrar filas
Ordenar filas
Tareas de agrupación de filas y columnas
Quitar filas con valores que faltan
Quitar filas duplicadas
Buscar y reemplazar valores que faltan
Crear una fórmula de columna

Select columns

Escenario: Solo quiere mostrar columnas específicas de una tabla por nombre, por tipo de datos o que coincidan con alguna expresión regular. Por ejemplo, en el conjunto de datos de ventas ficticio, solo quiere mostrar las columnas item_type y sales_channel, o solo quiere mostrar las columnas que contienen la cadena _date en los nombres de columna.

En la pestaña Data, en la lista desplegable Search actions, elija una de las opciones siguientes:
- Escriba select y, a continuación, elija Select or drop columns.
- Elija Select or drop columns.
En el panel Select or drop columns, en la lista desplegable Choose, elija Select.
Seleccione los nombres de las columnas de destino o el criterio de inclusión.
En Dataframe name, escriba un nombre para el identificador de programación del contenido de la tabla, como DataFrame, o deje df como identificador de programación predeterminado.
Haga clic en Ejecutar.

Quitar columnas

Escenario: Quiere ocultar columnas específicas de una tabla por nombre, por tipo de datos o que coincidan con alguna expresión regular. Por ejemplo, en el conjunto de datos de venta ficticio, quiere ocultar las columnas order_prio, order_date y ship_date, o bien desea ocultar todas las columnas que contienen solo valores de fecha y hora.

En la pestaña Data, en la lista desplegable Search actions, elija una de las opciones siguientes:
- Escriba drop y, a continuación, elija Select or drop columns.
- Elija Select or drop columns.
En el panel Select or drop columns, en la lista desplegable Choose, elija Drop.
Seleccione los nombres de las columnas de destino o el criterio de inclusión.
En Dataframe name, escriba un nombre para el identificador de programación del contenido de la tabla, como DataFrame, o deje df como identificador de programación predeterminado.
Haga clic en Ejecutar.

Filtrar filas

Escenario: Quiere mostrar u ocultar filas específicas de una tabla en función de criterios como los valores de columna específicos que coincidan o falten. Por ejemplo, en el conjunto de datos de venta ficticio, solo quiere mostrar las filas donde el valor de la columna item_type esté establecido en Baby Food.

En la pestaña Data, en la lista desplegable Search actions, elija una de las opciones siguientes:
- Escriba filter y, a continuación, seleccione Filter rows.
- Seleccione Filter rows.
En el panel Filter rows, en la lista desplegable Choose encima dewhere, seleccione Select rows o Drop rows.
Especifique el primer criterio de filtro.
Para agregar otro criterio de filtro, haga clic en add condition y especifique el siguiente criterio de filtro. Repita el proceso según sea necesario.
En Dataframe name, escriba un nombre para el identificador de programación del contenido de la tabla, como DataFrame, o deje df como identificador de programación predeterminado.
Haga clic en Ejecutar.

Ordenar filas

Escenario: Quiere ordenar las filas de una tabla en función de los valores de una o varias columnas. Por ejemplo, en el conjunto de datos de venta ficticio, quiere mostrar las filas por los valores de la columna region en orden alfabético de A a Z.

En la pestaña Data, en la lista desplegable Search actions, elija una de las opciones siguientes:
- Escriba sort y, a continuación, seleccione Sort rows.
- Seleccione Sort rows.
En el panel Sort column(s), elija la primera columna por la que ordenar y el criterio de ordenación.
Para agregar otro criterio de ordenación, haga clic en add column y especifique el siguiente criterio de ordenación. Repita el proceso según sea necesario.
En Dataframe name, escriba un nombre para el identificador de programación del contenido de la tabla, como DataFrame, o deje df como identificador de programación predeterminado.
Haga clic en Ejecutar.

Tareas de agrupación de filas y columnas

En esta sección:

Agrupar filas y columnas por una única función de agregado
Agrupar filas y columnas por varias funciones de agregado

Agrupar filas y columnas por una única función de agregado

Escenario: Quiere mostrar los resultados de filas y columnas mediante agrupaciones calculadas, y quiere asignar nombres personalizados a esas agrupaciones. Por ejemplo, en el conjunto de datos de venta ficticio, quiere agrupar las filas por los valores de la columna country, y mostrar los números de filas que contienen el mismo valor country y asignar a la lista de recuentos calculados el nombre country_count.

En la pestaña Data, en la lista desplegable Search actions, elija una de las opciones siguientes:
- Escriba group y, luego, seleccione Group by and aggregate (with renaming).
- Seleccione Group by and aggregate (with renaming).
En el panel Group by with column rename, seleccione las columnas por las que agrupar, el primer cálculo y, de manera opcional, especifique un nombre para la columna calculada.
Para agregar otro cálculo, haga clic en add calculation y especifique el siguiente cálculo y el nombre de columna. Repita el proceso según sea necesario.
Especifique dónde almacenar el resultado.
En Dataframe name, escriba un nombre para el identificador de programación del contenido de la tabla, como DataFrame, o deje df como identificador de programación predeterminado.
Haga clic en Ejecutar.

Agrupar filas y columnas por varias funciones de agregado

Escenario: Quiere mostrar los resultados de filas y columnas mediante agrupaciones calculadas. Por ejemplo, en el conjunto de datos de venta ficticio, quiere agrupar las filas por los valores de las columnas region, countryy sales_channel, y mostrar los números de filas que contienen el mismo valor region y country por sales_channel, así como total_revenue por la combinación única de region, country y sales_channel.

En la pestaña Data, en la lista desplegable Search actions, elija una de las opciones siguientes:
- Escriba group y, luego, seleccione Group by and aggregate (default).
- Seleccione Group by and aggregate (default).
En el panel Group by with column rename, seleccione las columnas por las que agrupar y el primer cálculo.
Para agregar otro cálculo, haga clic en add calculation y especifique el siguiente cálculo. Repita el proceso según sea necesario.
Especifique dónde almacenar el resultado.
En Dataframe name, escriba un nombre para el identificador de programación del contenido de la tabla, como DataFrame, o deje df como identificador de programación predeterminado.
Haga clic en Ejecutar.

Quitar filas con valores que faltan

Escenario: Quiere quitar toda fila donde falte un valor para las columnas especificadas. Por ejemplo, en el conjunto de datos de venta ficticio, quiere quitar las filas donde falte un valor item_type.

En la pestaña Data, en la lista desplegable Search actions, elija una de las opciones siguientes:
- Escriba drop o remove y, luego, seleccione Drop missing values.
- Seleccione Drop missing values.
En el panel Drop missing values, seleccione las columnas donde quitar las filas donde falte un valor para esa columna.
En Dataframe name, escriba un nombre para el identificador de programación del contenido de la tabla, como DataFrame, o deje df como identificador de programación predeterminado.
Haga clic en Ejecutar.

Quitar filas duplicadas

Escenario: Quiere quitar toda fila que tenga un valor duplicado en las columnas especificadas. Por ejemplo, en el conjunto de datos de venta ficticio, quiere quitar las filas que sean duplicados exactos entre sí.

En la pestaña Data, en la lista desplegable Search actions, elija una de las opciones siguientes:
- Escriba drop o remove y, luego, seleccione Drop/Remove duplicates.
- Seleccione Drop/Remove duplicates.
En el panel Remove Duplicates, seleccione las columnas para quitar las filas que tengan un valor duplicado en esas columnas y, a continuación, seleccione si quiere conservar la primera o la última fila que tenga el valor duplicado.
En Dataframe name, escriba un nombre para el identificador de programación del contenido de la tabla, como DataFrame, o deje df como identificador de programación predeterminado.
Haga clic en Ejecutar.

Buscar y reemplazar valores que faltan

Escenario: Quiere reemplazar el valor que falta por un valor de reemplazo para cualquier fila de las columnas especificadas. Por ejemplo, en el conjunto de datos de venta ficticio, quiere reemplazar las filas en las que falta un valor que en la columna item_type por el valor Unknown Item Type.

En la pestaña Data, en la lista desplegable Search actions, elija una de las opciones siguientes:
- Escriba find o replace y, luego, seleccione Find and replace missing values.
- Seleccione Find and replace missing values.
En el panel Replace missing values, seleccione las columnas en las que desea reemplazar los valores que faltan y, luego, especifique el valor de reemplazo.
Haga clic en Ejecutar.

Crear una fórmula de columna

Escenario: Quiere crear una columna que use una fórmula única. Por ejemplo, en el conjunto de datos de venta ficticio, quiere crear una columna denominada profit_per_unit que muestre el resultado de dividir el valor de columna total_profit por el valor de columna units_sold para cada fila.

En la pestaña Data, en la lista desplegable Search actions, elija una de las opciones siguientes:
- Escriba formula y, luego, seleccione New column formula.
- Seleccione New column formula.
En el panel Replace missing values, seleccione las columnas en las que desea reemplazar los valores que faltan y, luego, especifique el valor de reemplazo.
Haga clic en Ejecutar.

Tareas del historial acciones con datos

En esta sección:

Ver la lista de acciones realizadas en el widget
Deshacer la acción más reciente realizada en el widget
Rehacer la acción más reciente realizada en el widget
Cambiar la acción más reciente realizada en el widget

Escenario: Quiere ver una lista de todos los cambios realizados en el widget, empezando por el cambio más reciente.

Haga clic en History. La lista de acciones aparece en el panel Transformations history.

Escenario: Quiere revertir el cambio más reciente que se realizó en el widget.

Realice una de las siguientes acciones:

Haga clic en el icono con forma de flecha en sentido contrario a las agujas del reloj.
Haga clic en History y, en el panel Transformations history, haga clic en Undo last step.

Escenario: Quiere revertir la reversión más reciente que se realizó en el widget.

Realice una de las siguientes acciones:

Haga clic en el icono con forma de flecha en sentido de las agujas del reloj.
Haga clic en History y, en el panel Transformations history, haga clic en Recover last step.

Escenario: Quiere cambiar el cambio más reciente que se realizó en el widget.

Realice una de las siguientes acciones:
- Haga clic en el icono de lápiz.
- Haga clic en History y, en el panel Transformations history, haga clic en Edit last step.
Realice los cambios deseados y, luego, haga clic en Execute.

Obtención del código para volver a crear mediante programación el estado actual del widget como DataFrame

Escenario: Quiere obtener el código de Python que vuelva a crear mediante programación el estado del widget actual, representado como DataFrame de Pandas. Quiere ejecutar este código en otra celda de este libro o en otro libro.

Haga clic en Get Code.
En el panel Export code, haga clic en Copy code. El código se copia en el Portapapeles del sistema.
Pegue el código en otra celda de este libro o en otro libro.
Escriba código adicional para trabajar con este DataFrame de Pandas mediante programación y, luego, ejecute la celda. Por ejemplo, para mostrar el contenido del DataFrame, suponiendo que el DataFrame se representa mediante programación con df:
```
# Your pasted code here, followed by...
df
```

Limitaciones

Para más información, consulte Limitaciones conocidas de los cuadernos de Databricks.

Recursos adicionales

complementos de bamboolib

Compartir vía

bamboolib

Contenido

Requisitos

Inicio rápido

Tutoriales

Uso de bamboolib por sí mismo

Uso de bamboolib con un DataFrame existente

Tareas clave

En esta sección:

Adición del widget a una celda

Borrado del widget

Tareas de carga de datos

En esta sección:

Lectura del contenido de un conjunto de datos de ejemplo en el widget

Lectura del contenido de un archivo CSV en el widget

Lectura del contenido de una tabla de base de datos en el widget

Tareas de acciones con datos

En esta sección:

Select columns

Quitar columnas

Filtrar filas

Ordenar filas

Tareas de agrupación de filas y columnas

En esta sección:

Agrupar filas y columnas por una única función de agregado

Agrupar filas y columnas por varias funciones de agregado

Quitar filas con valores que faltan

Quitar filas duplicadas

Buscar y reemplazar valores que faltan

Crear una fórmula de columna

Tareas del historial acciones con datos

En esta sección:

Ver la lista de acciones realizadas en el widget

Deshacer la acción más reciente realizada en el widget

Rehacer la acción más reciente realizada en el widget

Cambiar la acción más reciente realizada en el widget

Obtención del código para volver a crear mediante programación el estado actual del widget como DataFrame

Limitaciones

Recursos adicionales

Comentarios

Recursos adicionales