Betöltés Delta Lake-táblába

A Microsoft Fabric Lakehouse szolgáltatása lehetővé teszi a gyakori fájltípusok hatékony betöltését egy elemzésre kész optimalizált Delta-táblába. A Betöltés táblázatba funkcióval a felhasználók egyetlen fájlt vagy fájlmappát tölthetnek be egy táblába. Ez a funkció növeli az adatmérnökök termelékenységét azáltal, hogy lehetővé teszi számukra a jobb gombbal történő kattintást a fájlok és mappák táblázatbetöltésének engedélyezéséhez. A táblába való betöltés szintén kód nélküli felület, amely csökkenti az összes személy belépési sávját.

A Load to Table (Betöltés a táblázatba) képességek áttekintése

Az alábbiakban felsoroljuk azokat a funkciókat, amelyeket a táblázatos felület integrált terhelésében engedélyeztünk, hogy rugalmasságot biztosítsunk a felhasználóknak a termelékenység növelése mellett:

  • Támogatott fájltípusok: Ez a funkció jelenleg csak a PARQUET- vagy CSV-fájltípusok betöltését támogatja. A fájlkiterjesztési eset nem számít.

  • Egyfájlos betöltés: A felhasználók a fájl helyi menüműveletében a "Betöltés deltatáblába" lehetőséget választva betölthetnek egy tetszőleges fájlt a támogatott formátumok egyikében.

  • Mappaszintű betöltés: A mappában és almappáiban lévő összes fájlt egyszerre töltheti be a "Betöltés a Delta-táblázatba" lehetőség kiválasztásával, miután rákattintott egy mappára. Ez a funkció automatikusan bejárja az összes fájlt, és betölti őket egy Delta-táblába. Fontos megjegyezni, hogy csak az azonos típusú fájlok tölthetők be egyszerre egy táblába.

  • Betöltés új és meglévő táblába: A felhasználó dönthet úgy, hogy egy új táblába vagy egy tetszőleges meglévő táblába tölti be a fájljait és mappáit. Ha úgy döntenek, hogy betöltenek egy meglévő táblába, lehetősége van arra, hogy hozzáfűzzék vagy felülírják az adataikat a táblában.

  • CSV-forrásfájl lehetőség: CSV-fájlok esetén lehetővé tesszük a felhasználó számára, hogy megadja, hogy a forrásfájl tartalmaz-e oszlopnévként használni kívánt fejléceket. A felhasználók megadhatnak egy elválasztót is, amely felülbírálja az alapértelmezett vesszőelválasztót.

  • Delta-táblákként töltve: A táblák mindig a Delta Lake táblaformátummal töltődnek be, és engedélyezve van a V-Order optimalizálás.

    Gif of overall load folder to table experience.

Érvényesítési irányelvek és szabályok

A következő szabvány a Terhelés táblára felületre vonatkozik:

  • A táblanevek csak alfanumerikus karaktereket és aláhúzásjeleket tartalmazhatnak. Emellett bármilyen angol betűt, nagybetűt vagy kisbetűt és aláhúzásjelet (_) is engedélyez, legfeljebb 256 karakter hosszúságú. Nem engedélyezett kötőjel (-) vagy szóköz karakter.

  • Az oszlopfejléceket nem tartalmazó szövegfájlokat a táblaoszlopok neveként szabványos col# jelöléssel helyettesíti a rendszer.

  • Az oszlopnevek bármely angol betűt, nagybetűt vagy kisbetűt, aláhúzásjelet (_) és más nyelven (például kínait UTF-ben) tartalmazhatnak , legfeljebb 32 karakter hosszúságúak. Az oszlopnevek érvényesítése a terhelési művelet során megtörténik. A Load to Delta algoritmus a tiltott értékeket alulsávra (_) cseréli. Ha az ellenőrzés során nem érhető el megfelelő oszlopnév, a terhelési művelet meghiúsul.

  • CSV-fájlok esetén az elválasztó nem lehet üres, nem lehet hosszabb 8 karakternél, és nem használhatja a következő karakterek egyikét: (, ), , ][, ,{} egyszeri idézőjel ('), dupla idézőjel (") és szóköz.