Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Von Bedeutung
Dieses Feature befindet sich in der Public Preview.
Mit der Veröffentlichung von Databricks Free Edition wird Community Edition (CE) bald eingestellt. Besitzer des Community Edition-Arbeitsbereichs sollten das Arbeitsbereichsmigrationstool verwenden, um so bald wie möglich zu Free Edition zu migrieren. Einen Featurevergleich zwischen Community Edition und Free Edition finden Sie im Featurevergleich.
Migrieren Ihres Arbeitsbereichs
Wenn Sie das Migrationstool verwenden, erstellt Azure Databricks einen neuen Free Edition-Arbeitsbereich, der mit Ihrer vorhandenen Anmeldung verknüpft ist. Anschließend werden Ihre Notizbücher und Daten zu Ihrem neuen Arbeitsbereich der Kostenlosen Edition migriert.
Sie können die Migration nur einmal ausführen. Achten Sie daher darauf, nicht verwendete Notizbücher und Tabellen vor dem Start zu bereinigen. Eine Liste der Einschränkungen für die Datenmigration finden Sie unter "Einschränkungen".
Schritt 1: Überprüfen Des aktuellen Arbeitsbereichs
Bevor Sie das Migrationstool verwenden, überprüfen Sie Ihren aktuellen Arbeitsbereich, und identifizieren Sie wichtige Notizbücher und Daten, die Sie migrieren möchten. Verschieben Sie alle Tabellen und Notizbücher, die Sie aus den Verzeichnissen tmp und Filestore migrieren möchten.
Schritt 2: Starten des Migrationsprozesses
Hinweis
Sie müssen der Arbeitsbereichsbesitzer sein, um das Migrationstool zu verwenden.
In Ihrem CE-Arbeitsbereich:
- Klicken Sie oben im Community Edition-Arbeitsbereich auf "Zur kostenlosen Edition wechseln".
- In einem Dialogfeld wird der Migrationsprozess erläutert.
- Klicke auf Migrieren. Ihr CE-Arbeitsbereich sperrt und Sie werden abgemeldet. Vermeiden Sie die Anmeldung, bis die Migration abgeschlossen ist.
- Wenn die Migration abgeschlossen ist (in der Regel unter 2 Stunden), erhalten Sie eine E-Mail mit einem Anmeldelink.
Schritt 3: Testen Des Arbeitsbereichs "Free Edition"
Wenn Sie sich anmelden, werden nun sowohl Ihre Community Edition- als auch Ihre Free Edition-Arbeitsbereiche angezeigt. Öffnen Sie beide Arbeitsbereiche, um zu bestätigen, dass alles zum Free Edition-Arbeitsbereich migriert wurde.
- Öffnen Sie Arbeitsbereich>Benutzer>[Ihre E-Mail], und vergewissern Sie sich, dass alle Ihre Notizbücher vorhanden sind.
- Öffnen Sie Catalog>Default und vergewissern Sie sich, dass alle Tabellen vorhanden sind.
- Führen Sie Schlüsselnotizbücher, Zelle nach Zelle aus. Wenn Fehler angezeigt werden, sehen Sie Häufige Probleme.
Hinweis
Möglicherweise stellen Sie fest, dass einige Tabellen in kleinere Teile aufgeteilt wurden. Dies wird erwartet. Siehe Meine Tabelle wurde in kleinere Teile unterteilt, um zu erfahren, wie man sie wieder zusammenfügt.
Schritt 4: Herunterladen fehlender Ressourcen aus Ihrem CE-Arbeitsbereich
Wenn objekte nicht übertragen wurden, können Sie sie manuell aus Ihrem Community Edition-Arbeitsbereich herunterladen und erneut in Ihren Free Edition-Arbeitsbereich hochladen.
Nach 7 Tagen wird Ihr Community Edition-Arbeitsbereich endgültig gelöscht. Vergewissern Sie sich, dass alle Inhalte vor diesem Datum in Ihren neuen Arbeitsbereich übertragen wurden.
Einschränkungen
Die Migration überträgt möglicherweise nicht alle Ressourcen. Überprüfen Sie die folgenden Einschränkungen vor dem Starten der Migration:
- Free Edition hat eine harte Grenze von 500 Tabellen. Wenn Sie mehr als 500 Tabellen in Ihrem Community Edition-Arbeitsbereich haben, werden nicht alle Tabellen migriert.
- Bei Tabellen oder Teilen von Tabellen, die archiviert wurden, versucht die Migration, sie zu migrieren, aber sie werden möglicherweise als Fehler im Abfrageverlauf angezeigt. Die automatische Archivierung erfolgt für Daten, auf die 3+ Monate nicht zugegriffen wurde.
- Das Migrieren von CSV-Dateien erfordert bestmögliche Bemühung. Es kann vorkommen, dass das Trennzeichen falsch verwendet wird und Spalten gruppiert werden oder die Tabelle nicht erstellt werden kann.
- Nur unterstützte Dateien und Datentypen werden migriert. Wenn Sie eines dieser Ressourcen benötigen, laden Sie diese manuell aus Ihrem Arbeitsbereich herunter, bevor Sie mit der Migration beginnen. Die folgenden Datei- und Datentypen werden nicht migriert:
-
.zipDateien,.mp4Videos, Systemprotokolle - XML-Dateien
- Ausgeblendete Dateien oder nicht unterstützte Formate
- MLflow-Experimente
- Alles unter
tmpoderFilestore - Außerhalb gespeicherte Dateien
dbfs:/
-
Behandeln häufiger Probleme
Ich kann keine Clustergröße oder einen Instanztyp auswählen.
Free Edition verwendet serverlose Compute, sodass Sie die Clustergröße oder den Instanztyp nicht anpassen können. Serverlose Berechnung wird basierend auf Ihren Workloadanforderungen automatisch skaliert.
Tipp
Führen Sie eine Zelle aus, um die serverlose Berechnung automatisch zu starten, oder wählen Sie eine Computeressource aus dem Dropdownmenü aus. Wenn Verzögerungen oder Fehler auftreten, reduzieren Sie die Arbeitsauslastung und versuchen Sie es dann nach ein paar Minuten erneut.
Eine meiner Dateien wurde nicht übertragen
Dies geschieht, wenn die Datei entweder ein nicht standardmäßiges Format (zum Beispiel .mp4), ausgeblendet oder nicht unterstützt war.
Tipp
Laden Sie die Datei innerhalb von 7 Tagen aus Ihrem Community Edition-Arbeitsbereich herunter, und laden Sie sie manuell in Ihren Free Edition-Arbeitsbereich hoch.
Meine Tabelle wurde in kleinere Teile aufgeteilt
Einige CE-Tabellen wurden durch große Dateien gesichert, die in Fragmenten gespeichert wurden. Während der Migration kopiert Azure Databricks jeden Teil als eigene Tabelle.
Tipp
Kombinieren Sie mit UNION ALL:
CREATE OR REPLACE TABLE my_full_table AS
SELECT * FROM my_table_part1
UNION ALL
SELECT * FROM my_table_part2
UNION ALL
SELECT * FROM my_table_part3;
Meine Tabelle wurde übertragen, aber mein Notizbuch kann es nicht finden.
Ihr Notebook verweist wahrscheinlich über den Namen auf eine Tabelle, aber der Name der Tabelle wurde während der Migration geändert.
In free Edition werden alle Tabellen erstellt in workspace.default.<table_name>. Der Tabellenname lautet entweder:
- Das Verzeichnis, das die Datei enthält.
/my_table/my_table_data_file.parquetwirdmy_tablegenannt. - Befindet es sich im Wurzelverzeichnis des DBFS, wird der Dateiname verwendet.
/my_table_data_file.parquetwirdmy_table_data_filegenannt.
Tipp
Suchen Sie die zugrunde liegende Tabelle im Katalog.
Kopieren Sie den Dateinamen der Tabelle.
Kehren Sie zum Notizbuch zurück.
Weisen Sie den Genie Code an, alle Instanzen der alten Tabellenposition durch die neue Tabellenposition zu ersetzen:
Replace all references to 'old_table_name' with 'workspace.default.new_table_name' in this notebook
Mein Notebook-Code funktioniert nicht
Dies fällt in der Regel in zwei Kategorien:
Fall 1: Sie verwenden RDDs
RDDs sind eine ältere Spark-Abstraktion und werden in der Free Edition nicht unterstützt. Ersetzen Sie sie durch DataFrames.
Tipp
Bitten Sie den Genie Code, Ihren RDD-Code zu konvertieren:
Convert all RDD operations in this notebook to DataFrame operations
Fall 2: Sie verwenden Scala oder R
Serverless Compute unterstützt nur Python und SQL. Wenn Ihr Notizbuch Scala oder R verwendet, müssen Sie es in Python übersetzen.
Tipp
Bitten Sie den Genie Code, Ihren Code zu übersetzen:
Convert this Scala/R code to Python using PySpark DataFrames
dbutils.fs.mount Befehle schlagen fehl.
Neue Azure Databricks-Arbeitsbereiche unterstützen keine älteren DBFS-Einbindungen.
Tipp
Verwenden Sie stattdessen externe Speicherorte und Volumes im Unity-Katalog. Erstellen Sie ein Volume zum Speichern von Datensätzen oder freigegebenen Dateien.
CREATE VOLUME IF NOT EXISTS workspace.default.my_volume;
Greifen Sie dann auf Dateien zu, indem Sie folgendes verwenden:
# Write data
df.write.mode("overwrite").option("path", "/Volumes/workspace/default/my_volume/my_data").saveAsTable("my_table")
# Read data
df = spark.read.table("my_table")
Ich kann Dateien in /dbfs/ nicht lesen oder schreiben.
Free Edition beschränkt den direkten Zugriff auf den DBFS-Stamm zur Sicherheit.
Tipp
Verwenden Sie ein Unity-Katalogvolume zum Speichern von Datasets oder freigegebenen Dateien:
# Create a volume (run once)
spark.sql("CREATE VOLUME IF NOT EXISTS workspace.default.my_data_volume")
# Write files
dbutils.fs.cp("file:/local/path/data.csv", "/Volumes/workspace/default/my_data_volume/")
# Read files
df = spark.read.csv("/Volumes/workspace/default/my_data_volume/data.csv", header=True, inferSchema=True)
Funktionsvergleich
In der folgenden Tabelle werden die features verglichen, die in Community Edition und Free Edition verfügbar sind:
| Merkmal | Community-Version | Kostenlose Edition |
|---|---|---|
| Notebooks | ✓ | ✓ |
| MLflow | ✓ | ✓ |
| Aufnahme | ✓ | |
| Jobs | ✓ | |
| Pipelines | ✓ | |
| Dashboards | ✓ | |
| Genie | ✓ | |
| Semantische Suche | ✓ | |
| Modellbereitstellung | ✓ | |
| Modellauswertung | ✓ | |
| Agenten | ✓ | |
| Unity-Katalog | ✓ | |
| Reinräume | ||
| Lakebase | ||
| Wissensassistent , Supervisor Agent | ||
| Funktionen für Unternehmensadministratoren | ||
| Klassische Berechnung | ✓ | |
| Serverloses Rechnen | ✓ | |
| GPUs | Bring Your Own |