Delta Lake-táblák olvasása (Synapse vagy külső hely)
Fontos
Ez a szolgáltatás jelenleg előzetes kiadásban elérhető. A Microsoft Azure Előzetes verzió kiegészítő használati feltételei további jogi feltételeket tartalmaznak, amelyek a bétaverzióban, előzetes verzióban vagy egyébként még nem általánosan elérhető Azure-funkciókra vonatkoznak. Erről az adott előzetes verzióról az Azure HDInsight az AKS előzetes verziójában tájékozódhat. Ha kérdése vagy funkciójavaslata van, küldjön egy kérést az AskHDInsightban a részletekkel együtt, és kövessen minket további frissítésekért az Azure HDInsight-közösségről.
Ez a cikk áttekintést nyújt arról, hogyan olvashatja el a Delta Lake-táblázatokat anélkül, hogy bármilyen hozzáférése volna a metaadattárhoz (Synapse vagy más, nyilvános hozzáférés nélküli metaadattárak).
A táblákon a következő műveleteket hajthatja végre a Trino és a HDInsight használatával az AKS-en.
- Törlés...
- UPDATE
- INSERT
- EGYESÍTÉSE
Előfeltételek
- A Delta Lake-katalógus konfigurálása.
Delta Lake-sémák és -táblák létrehozása
Ez a szakasz bemutatja, hogyan hozhat létre Delta-táblát egy már meglévő helyen, ha már van delta lake-katalógusa konfigurálva.
Tallózással keresse meg a tárfiókot az
Storage browser
Azure Portalon, ahol a tábla alapkönyvtára található. Ha ez a tábla a Synapse-ból származik, valószínűleg egysynapse/workspaces/.../warehouse/
elérési út alatt található, és a tábláról lesz elnevezve, és tartalmaz egy könyvtárat_delta_log
. Válassza kiCopy URL
a mappa melletti három pont közül.Ezt a HTTP-elérési utat ABFS -elérési útra (Azure Blob Fájlrendszer) kell konvertálnia:
A tároló http-elérési útja a következőképpen van strukturálva:
https://{{AZURE_STORAGE_ACCOUNT}}.blob.core.windows.net/{{AZURE_STORAGE_CONTAINER}}/synapse/workspaces/my_workspace/warehouse/{{TABLE_NAME}}/
Az ABFS elérési útjainak így kell kinéznie:
abfss://{{AZURE_STORAGE_CONTAINER}}@{{AZURE_STORAGE_ACCOUNT}}.dfs.core.windows.net/synapse/workspaces/my_workspace/warehouse/{{TABLE_NAME}}/
Példa:
abfss://container@storageaccount.dfs.core.windows.net/synapse/workspaces/workspace_name/warehouse/table_name/
Delta Lake-séma létrehozása Trinóban.
CREATE SCHEMA delta.default;
Másik lehetőségként létrehozhat egy sémát egy adott tárfiókban is:
CREATE SCHEMA delta.default WITH (location = 'abfss://container@storageaccount.dfs.core.windows.net/trino/');
register_table
Az eljárás használatával hozza létre a táblát.CALL delta.system.register_table(schema_name => 'default', table_name => 'table_name', table_location => 'abfss://container@storageaccount.dfs.core.windows.net/synapse/workspaces/workspace_name/warehouse/table_name/');
Ellenőrizze a táblát.
SELECT * FROM delta.default.table_name
Delta Lake-táblák írása a Synapse Sparkban
Az format("delta")
adatkeretet Delta-táblaként mentheti, majd használhatja azt az elérési utat, ahová az adatkeretet delta formátumúként mentette, hogy regisztrálja a táblát Trinóban.
my_dataframe.write.format("delta").save("abfss://container@storageaccount.dfs.core.windows.net/synapse/workspaces/workspace_name/warehouse/table_name")