Condividi tramite


Runtime di Fabric 2.0 (Anteprima)

Importante

Questa funzionalità si trova in Anteprima.

Fabric Runtime offre una perfetta integrazione all'interno dell'ecosistema Microsoft Fabric, offrendo un ambiente affidabile per progetti di data engineering e data science basati su Apache Spark.

Questo articolo presenta Fabric Runtime 2.0 Public Preview, il runtime più recente progettato per i calcoli di Big Data in Microsoft Fabric. Evidenzia le funzionalità e i componenti chiave che rendono questa versione un passo avanti significativo per l'analisi scalabile e i carichi di lavoro avanzati.

Fabric Runtime 2.0 incorpora i componenti e gli aggiornamenti seguenti progettati per migliorare le funzionalità di elaborazione dei dati:

  • Apache Spark 4.0
  • Sistema operativo: Azure Linux 3.0 (Mariner 3.0)
  • Java: 21
  • Scala: 2.13
  • Python: 3.12
  • Delta Lake: 4.0
  • R: 4.5.2

Suggerimento

Fabric Runtime 2.0 include il supporto per il motore di esecuzione nativo, che può migliorare significativamente le prestazioni senza costi aggiuntivi. È possibile abilitare il motore di esecuzione nativo a livello di ambiente in modo che tutti i processi e i notebook ereditino automaticamente le funzionalità di prestazioni avanzate.

Abilitare Runtime 2.0

È possibile abilitare Runtime 2.0 a livello di area di lavoro o di elemento dell'ambiente. Usare l'impostazione dell'area di lavoro per applicare Runtime 2.0 come impostazione predefinita per tutti i carichi di lavoro Spark nell'area di lavoro. In alternativa, creare un elemento di ambiente con Runtime 2.0 da usare con notebook specifici o definizioni di processi Spark, che sostituisce l'impostazione predefinita dell'area di lavoro.

Abilitare Runtime 2.0 nelle impostazioni dell'area di lavoro

Per impostare Runtime 2.0 come predefinito per l'intera area di lavoro:

  1. Accedere alla pagina Impostazioni area di lavoro all'interno dell'area di lavoro Fabric.

    Screenshot che mostra dove selezionare la versione di runtime per le impostazioni dell'area di lavoro.

  2. Selezionare la scheda Ingegneria dati/Scienza e quindi selezionare Impostazioni Spark.

  3. Fare clic sulla scheda Ambiente.

  4. Nell'elenco a discesa Versione di runtime selezionare Anteprima pubblica 2.0 (Spark 4.0, Delta 4.0) e salvare le modifiche.

  5. Runtime 2.0 è impostato come runtime predefinito per l'area di lavoro.

Abilitare Runtime 2.0 in un elemento Ambiente

Per utilizzare Runtime 2.0 con notebook specifici o definizioni di job Spark:

  1. Creare un nuovo elemento Environment o aprirne uno esistente.

  2. Nell'elenco a discesa Runtime selezionare Anteprima pubblica 2.0 (Spark 4.0, Delta 4.0)Save e Publish le modifiche apportate.

    Screenshot che mostra dove selezionare la versione di runtime per l'elemento Environment.

  3. A questo punto, è possibile usare questo elemento Environment con Notebook o Spark Job Definition.

È ora possibile iniziare a sperimentare i miglioramenti e le funzionalità più recenti introdotti in Fabric Runtime 2.0 (Spark 4.0 e Delta Lake 4.0).

Annotazioni

Il protocollo WASB per gli account di archiviazione di Azure per utilizzo generico v2 (GPv2) è deprecato. Si consiglia di utilizzare invece il protocollo ABFS più recente per la lettura e la scrittura negli account di archiviazione GPv2.

Anteprima pubblica

La fase di anteprima pubblica di Fabric Runtime 2.0 consente di accedere a nuove funzionalità e API sia da Spark 4.0 che da Delta Lake 4.0. L'anteprima consente di usare immediatamente i miglioramenti più recenti basati su Spark e Delta, oltre a garantire una corretta preparazione e transizione per modifiche migliorate e migliorate, ad esempio le versioni più recenti di Java, Scala e Python.

Suggerimento

Per informazioni aggiornate, un elenco dettagliato delle modifiche e delle note sulla versione specifiche per i runtime di Fabric, controllare e iscriversi a Release e aggiornamenti dei runtime di Spark.

Punti salienti

Apache Spark 4.0

Apache Spark 4.0 segna una pietra miliare significativa come versione inaugurale della serie 4.x, incarnando lo sforzo collettivo della vivace community open source.

In questa versione Spark SQL è notevolmente arricchita con potenti nuove funzionalità progettate per aumentare l'espressività e la versatilità per i carichi di lavoro SQL, ad esempio il supporto dei tipi di dati VARIANT, le funzioni definite dall'utente SQL, le variabili di sessione, la sintassi pipe e le regole di confronto di stringhe. PySpark vede l'impegno continuo sia per l'ampiezza funzionale che per l'esperienza di sviluppo complessiva, introducendo un'API nativa per i grafici, una nuova API per le origini dati Python, il supporto per UDTF Python e la profilatura unificata per gli UDF di PySpark, insieme a numerosi altri miglioramenti. Structured Streaming si evolve con aggiunte chiave che offrono maggiore controllo e facilità di debug, in particolare l'introduzione dell'API Stato arbitrario v2 per una gestione più flessibile dello stato e l'origine dati stato per semplificare il debug.

È possibile controllare l'elenco completo e le modifiche dettagliate qui: https://spark.apache.org/releases/spark-release-4-0-0.html.

Annotazioni

In Spark 4.0 SparkR è deprecato e potrebbe essere rimosso in una versione futura.

Delta Lake 4.0

Delta Lake 4.0 è un impegno collettivo per rendere l'interoperabilità delta Lake tra formati, più facile da usare e prestazioni più elevate. Delta 4.0 è una versione cardine ricca di potenti nuove funzionalità, ottimizzazioni delle prestazioni e miglioramenti fondamentali per il futuro di data lakehouse aperti.

È possibile controllare l'elenco completo e le modifiche dettagliate introdotte con Delta Lake 3.3 e 4.0 qui: https://github.com/delta-io/delta/releases/tag/v3.3.0. https://github.com/delta-io/delta/releases/tag/v4.0.0.

Importante

Le funzionalità specifiche di Delta Lake 4.0 sono sperimentali e funzionano solo su esperienze Spark, ad esempio notebook e definizioni di processi Spark. Se è necessario usare le stesse tabelle Delta Lake in più carichi di lavoro di Microsoft Fabric, non abilitare tali funzionalità. Per altre informazioni sulle versioni e sulle funzionalità del protocollo compatibili con tutte le esperienze di Microsoft Fabric, vedere Interoperabilità dei formati di tabella Delta Lake.