Compartir a través de


Ingesta de datos en Microsoft Planetary Computer Pro

Las funcionalidades de ingesta de Microsoft Planetary Computer Pro permiten a los usuarios traer sus propios datos a una plataforma habilitada para la nube eficaz en la indexación, el almacenamiento y la consulta de recursos geoespaciales a escala. Los datos integrados y almacenados en un Planetary Computer Pro GeoCatalog usan el estándar abierto SpatioTemporal Asset Catalog (STAC) para indexar, consultar y recuperar datos geoespaciales. Para obtener más información sobre STAC, consulte Información general sobre STAC.

En este diagrama se proporciona información general sobre cómo funcionan conjuntamente los distintos elementos del servicio de ingesta:

Diagrama que muestra la ingesta segura en Microsoft Planetary Computer Pro.

Prerrequisitos

Orígenes de ingesta

Los orígenes de ingesta son representaciones de los mecanismos de autenticación y ubicación necesarios para ingerir datos en un recurso GeoCatalog. Los usuarios pueden enumerar y configurar orígenes de ingesta en la pestaña Configuración de la interfaz web o mediante geocatalog API. Una vez establecido el origen de ingesta, los datos almacenados en esa ubicación están disponibles para la ingesta segura en GeoCatalog.

Captura de pantalla de GeoCatalog Portal en la que se muestra dónde se encuentra el botón Configuración.

Tipos de almacenamiento admitidos

Planetary Computer Pro admite la ingesta de recursos geoespaciales de los siguientes orígenes de almacenamiento:

  • Azure Blob Storage con identidad administrada y tokens de SAS
  • Direcciones URL públicas
  • Cubos S3 con claves firmadas

Advertencia

Todos los datos ingeridos en Planetary Computer Pro requieren elementos STAC.

Sugerencia

Para acelerar la creación de STAC Items, tenemos un tutorial detallado y también tenemos una herramienta de código abierto denominada STAC Forge.

Métodos de ingesta

Al proporcionar un origen de ingesta, como un contenedor de almacenamiento de blobs o una dirección URL pública, Planetary Computer Pro puede acceder a los datos. Puede incorporar colecciones de STAC, elementos de STAC y activos almacenados en la ubicación especificada en Planetary Computer Pro. El recurso GeoCatalog debe tener acceso tanto al JSON de la colección STAC como a los recursos geoespaciales (imágenes, datos, etc.) a los que apuntan los elementos STAC de la colección STAC.

Durante el proceso de ingesta, los archivos GEOTIFF, JPEG, JPEG2000, PNG y TIFF se transforman en COG (GeoTIFF optimizados para la nube), pero los usuarios también pueden seleccionar una opción para copiar archivos originales.

Nota:

Los datos que ya están en formato COG no se transforman.

La ingesta también admite la optimización en la nube para varios formatos de cubo de datos; consulte Información general del cubo de datos Los usuarios también pueden seleccionar para omitir determinados elementos del catálogo.

Hay dos métodos de ingesta disponibles en función del caso de uso: ingesta masiva y ingesta de un solo elemento. Cada uno se puede realizar a través de la interfaz web o la API.

Ingesta masiva

La ingesta masiva permite a los usuarios ingerir automáticamente una colección STAC existente, incluido su archivo JSON de colección, elementos de STAC asociados y los recursos de STAC subyacentes (imágenes, datos, etc.). La ingesta masiva mueve rápidamente estos artefactos a un GeoCatalog especificando el origen de datos (por ejemplo, Blob Storage), el URL de conexión y el tipo de elemento. Ingestión masiva utiliza estas entradas y parámetros para ejecutar un proceso de ingestión. Para obtener más información sobre la ingesta masiva, consulte Ingesta de datos en GeoCatalog con la API de ingesta masiva.

Captura de pantalla de la GUI de ingesta masiva.

Ingesta de un solo elemento

Dada una colección de STAC preexistente dentro de geocatalog, los usuarios pueden ingerir elementos STAC nuevos o actualizar los existentes y sus recursos asociados mediante la interfaz web de Planetary Computer Pro o la API. A diferencia de la característica de ingesta masiva de Planetary Computer Pro, la ingesta de un solo elemento está pensada para importaciones o actualizaciones de baja latencia en lugar de grandes migraciones de datos. Para obtener más información sobre la ingesta masiva, vea Agregar elementos STAC a una colección.

Captura de pantalla de la GUI de ingesta de un solo elemento.

Pasos siguientes

Obtenga más información sobre cómo configurar un origen de ingesta: