Consulte Ingesta de datos en una instancia de Databricks Lakehouse
Azure Databricks ofrece varias maneras de ingerir datos desde varias fuentes en un almacén de lago con el respaldo de Delta Lake. En este artículo se enumeran los orígenes de datos y se proporcionan vínculos a los pasos para ingerir datos de cada tipo de origen.
Almacenamiento de objetos en la nube
Para obtener información sobre cómo configurar la ingesta incremental desde el almacenamiento de objetos en la nube, consulte Ingesta de datos desde el almacenamiento de objetos en la nube.
LakeFlow Connect
Databricks LakeFlow Connect ofrece conectores nativos para la ingesta de bases de datos y aplicaciones empresariales. La canalización de ingesta resultante se rige por Unity Catalog y cuenta con tecnología de proceso sin servidor y Delta Live Tables.
LakeFlow Connect aprovecha las lecturas y escrituras incrementales eficaces para que la ingesta de datos sea más rápida, más escalable y más rentable, mientras que los datos permanecen al día para el consumo de bajada.
Orígenes de streaming
Azure Databricks se puede integrar con los servicios de mensajería de flujo de datos para llevar a cabo tareas de ingesta de datos casi en tiempo real en un almacén de lago. Consulte Streaming e ingesta incremental.
Archivos de base de datos local
Puede cargar archivos de datos locales de forma segura o descargar archivos desde una dirección URL pública. Vea Carga de archivos en Azure Databricks.
Migración de datos a Delta Lake
Para obtener información sobre cómo migrar datos existentes a Delta Lake, consulte Migración de datos a Delta Lake.