Condividi tramite


Febbraio 2020

Queste funzionalità e i miglioramenti della piattaforma Azure Databricks sono stati rilasciati a febbraio 2020.

Nota

Le versioni vengono messe in scena. L'account Azure Databricks potrebbe non essere aggiornato fino a una settimana dopo la data di rilascio iniziale.

Databricks Runtime 6.4 per Genomica in versione generale

26 febbraio 2020

Databricks Runtime 6.4 per Genomica è basato su Databricks Runtime 6.4. Include numerosi miglioramenti e aggiornamenti da Databricks Runtime 6.3 per Genomica.

Le funzionalità principali sono:

  • È ora possibile personalizzare la pipeline DNASeq consentendo agli utenti di disabilitare selettivamente qualsiasi combinazione legittima delle fasi di allineamento delle letture, chiamata variante e annotazione variante. Gli utenti possono anche eseguire l'allineamento di letture a singolo terminale.
  • La versione di Glow inclusa in Databricks Runtime 6.4 per Genomica offre ora API Python e Scala per le funzioni esposte in precedenza solo tramite espressioni SQL. Queste funzioni sono disponibili per le operazioni dataframe, offrendo una maggiore sicurezza in fase di compilazione.

Databricks Runtime 6.4 ML disponibile a livello generale

26 febbraio 2020

Databricks Runtime 6.4 ML offre aggiornamenti della libreria, tra cui:

  • PyTorch: da 1.3.1 a 1.4.0
  • Horovod: da 0.18.2 a 1.19.0

Per informazioni dettagliate, vedere le note sulla versione completa di Databricks Runtime 6.4 per ML (EoS).

Databricks Runtime 6.4 disponibile a livello generale

26 febbraio 2020

Databricks Runtime 6.4 GA offre nuove funzionalità, miglioramenti e molte correzioni di bug.

  • Elaborare i nuovi file di dati in modo incrementale con il caricatore automatico (anteprima pubblica). Il Auto Loader offre un modo più efficiente per elaborare i nuovi file di dati in modo incrementale man mano che arrivano in un archivio di blob nel cloud durante ETL. Si tratta di un miglioramento rispetto allo streaming strutturato basato su file, che identifica i nuovi file elencando ripetutamente la directory cloud e monitorando i file visualizzati e può essere molto inefficiente man mano che la directory cresce.
  • Caricare i dati in Delta Lake con tentativi idempotenti (anteprima pubblica). Il COPY INTO comando SQL consente di caricare i dati in Delta Lake con ripetizioni idempotenti (versione in anteprima pubblica). Per caricare i dati in Delta Lake, è necessario usare le API dataframe di Apache Spark. Se si verificano errori durante i carichi, è necessario gestirli in modo efficace.
  • Metriche operative per tutte le operazioni di scrittura, aggiornamenti ed eliminazioni in una tabella Delta ora visualizzata nella cronologia delle tabelle.
  • Le figure matplotlib inline ora abilitate per impostazione predefinita nei notebook di Azure Databricks (anteprima pubblica).

Per informazioni dettagliate, vedere le note sulla versione complete di Databricks Runtime 6.4 (EoS).

Nuovi grafici interattivi che offrono interazioni avanzate lato client

25 febbraio - 3 marzo 2019: versione 3.14

Questa versione introduce due nuovi tipi di grafico interattivo che sostituiscono le implementazioni del grafico a barre e del grafico a linee. Oltre alle funzionalità del grafico esistenti, il grafico a linee include alcune nuove opzioni di tracciato personalizzato: l'impostazione di un intervallo dell'asse Y, la visualizzazione o la nascondere degli indicatori e l'applicazione della scala del log all'asse Y. Entrambi i grafici hanno una barra degli strumenti integrata che supporta un ricco set di interazioni lato client.

Barra degli strumenti dei grafici

Se desideri usare le implementazioni dei grafici esistenti, puoi selezionarle dal menu a discesa Grafici legacy. I grafici esistenti continueranno a usare le implementazioni disponibili in precedenza.

Tipi di Grafici Legacy

Nuova rete di inserimento di dati che aggiunge le integrazioni dei partner con Delta Lake (anteprima pubblica)

24 febbraio 2020

Ora puoi popolare facilmente il tuo "lakehouse"—il data lake potenziato dai tipi di strutture di dati e dalle funzionalità di gestione dei dati che in genere si ottengono con un data warehouse—da centinaia di origini dati in Delta Lake. Al centro di questa rete c'è la nuova galleria di integrazioni partner, accessibile dall'area di lavoro, che fornisce accesso a un'enorme rete di origini dati tramite i nostri partner Fivetran, Qlik, Infoworks, StreamSets e Syncsort.

Portale di integrazioni dei partner

Per una panoramica, vedere il blog. Per informazioni dettagliate, vedere Partner tecnologici.

Il creatore dell'area di lavoro viene automaticamente aggiunto come amministratore di Azure Databricks

24 febbraio 2020

Prima del 24 febbraio 2020, l'utente che ha creato un'area di lavoro di Azure Databricks verrà aggiunto solo come utente amministratore per l'area di lavoro se ha fatto clic sul pulsante Avvia area di lavoro nel portale di Azure o è stato aggiunto come amministratore da un utente che era già un utente amministratore nell'area di lavoro (qualsiasi Collaboratore di Azure per la sottoscrizione che ha fatto clic sul pulsante Avvia area di lavoro verrebbe creato come utente amministratore nell'area di lavoro). Ora l'utente che crea l'area di lavoro verrà aggiunto automaticamente come amministratore dell'area di lavoro.

Per informazioni dettagliate sulla creazione e l'avvio di aree di lavoro, vedere Gestire la sottoscrizione

Flag per la gestione della sicurezza dell’area di lavoro e delle funzionalità dei notebook ora disponibili

4-11 febbraio 2020: versione 3.12

Questa versione introduce nuovi flag per gestire le intestazioni di sicurezza inviate per impedire attacchi all'area di lavoro, nonché per accedere ai download dei risultati dei notebook e al versionamento Git. Tutte queste opzioni amministrative sono abilitate per impostazione predefinita.