Ezt a böngészőt már nem támogatjuk.
Frissítsen a Microsoft Edge-re, hogy kihasználhassa a legújabb funkciókat, a biztonsági frissítéseket és a technikai támogatást.
Melyik definíció írja le a legjobban az Apache Sparkot?
Nagy mértékben skálázható relációs adatbázis-kezelő rendszer.
Egy Python-futtatókörnyezettel rendelkező virtuális kiszolgáló.
Elosztott platform párhuzamos adatfeldolgozáshoz több nyelven.
A Spark használatával elemezni kell az adatokat egy parquet-fájlban. Mi a teendőm?
Töltse be a parquet-fájlt egy adatkeretbe.
Importálja az adatokat egy kiszolgáló nélküli SQL-készlet táblájába.
Konvertálja az adatokat CSV formátumba.
Olyan jegyzetfüzetcellába szeretne kódot írni, amely SQL-lekérdezéssel kéri le az adatokat a Spark-katalógus nézetéből. Melyik varázslatot érdemes használnia?
%%spark
%%pyspark
%%sql
A munka ellenőrzése előtt minden kérdésre válaszolnia kell.
Folytatás
Hasznosnak találta ezt az oldalt?